论文部分内容阅读
行人检测是计算机视觉领域的研究热点之一,也是智能交通和无人驾驶技术的重要研究内容;同时还是众多视觉应用的基础,比如行人跟踪与行人行为识别。目前行人检测方法从传感器角度主要可分为基于单目视觉、立体视觉以及融合视觉与激光雷达等三种方式。其中,基于单目视觉的方式容易受光照和角度的影响;立体视觉获得的深度图像具有速度较慢且不稳定的缺陷;激光雷达获取的点云则太稀疏,导致物体类别层面的识别变得困难。由于在RGB图像的基础上引入了深度图像,RGB-D图像比立体视觉产生更快更稳定的深度图以及比激光雷达提供更丰富的点云信息,因此最近几年引起研究人员的广泛关注。目前基于RGB-D的各类研究仅限于采用Kinect等可以使用的室内环境;对于室外环境,由于受到传感器等因素的限制,基于RGB-D的行人检测尚未有相关论文发表,因此非常值得研究。 本文针对行人检测的难点以及RGB-D的优势与局限性,展开室外环境下基于RGB-D行人检测的方法研究。本文的主要工作和主要贡献总结如下: 提出一套室外环境下采集RGB-D图像的方案,该方案基于普通RGB相机以及TOF相机;创新地提出一种基于针孔相机模型的图像配准方法,取得了良好的效果。 针对行人检测领域缺乏公开的室外RGB-D数据库的情况,我们建立了基于RGB-D的行人检测数据库。该数据库包含了不同时段、不同环境下拍摄的12000多张图像(对),并对数据库中的行人做了仔细的标注。针对深度相机采集的图像中存在大量噪声的问题,本文提出了一种局部方差自适应阈值的去噪方法,相比于高斯低通滤波器,该方法能够在保证图像质量的情况下有效滤除一定范围内的图像噪声。 受主动传感器可以更容易探测到空间中物体的启发,论文创新地提出了一种基于深度信息引导的行人检测框架,这种检测框架可以为RGB图像中的行人检测缩小搜索区域,从而节省大量的计算。由于基于深度图像的特征提取方法很少,本文将图像识别领域中的核化特征方法引入到RGB-D的行人检测问题中,以提升行人检测的效果。在数据融合策略上,本文改进了一种在分类器层级的融合策略,这种策略比原始的策略具有更强的自适应性,并通过实验证明了基于RGB-D的行人检测方法的可行性与有效性。