论文部分内容阅读
行人检测是计算机视觉领域重要的研究课题,由于其广泛的应用场景和巨大的商业价值,一直以来都是研究的热点。 虽然行人检测经过了长期的发展,已经取得了一些进展,但其性能距离实际应用的要求依然有一定的差距,仍有很大的发展空间。目前,仅仅利用单一的颜色数据的行人检测技术已很难有较大幅度的提升,综合利用多种传感器数据和多种特征来提升检测效果是目前行人检测领域的一个新的发展方向。 三维空间信息能够直接反映检测对象的形状,已有研究证明在行人检测应用中,三维空间信息是颜色信息的很好补充,能够大幅提高行人检测的性能。但是,目前采用三维空间信息的研究大多基于微软Kinect采集的深度数据。由于Kinect设备有效采集距离短、画面范围窄且在光线较亮时采集效果差,仅适用于室内的人机交互应用,在室外的大范围行人检测应用领域中并不实用。近年来,立体匹配技术取得了长足发展。通过立体匹配技术计算得到的双目视差三维数据,具有取景范围大,有效距离广、分辨率高等特点。相较于Kinect深度数据,双目视差三维数据更适合于环境复杂的室外行人检测应用。 根据半稠密视差数据的特点,本文提出两种综合利用颜色和视差数据进行行人检测的方法: (1)第一种方法首先利用视差数据进行粗检测,然后利用颜色数据进行精确检测,从而大大提高了检测效率,并在一定程度上减少了误检; (2)第二种方法提出了一种针对半稠密视差数据的描述子DBLP(Disparity Block Local Parten),并设计了一种融合灰度和视差数据进行快速行人检测的方案。 两种方法从不同侧面将颜色和视差数据所提供的信息有效结合,虽然各自有不同的适用条件,但均在效果上相较传统的使用单一数据的检测方法有所提升。