论文部分内容阅读
目标检测是计算机视觉领域基础且核心重要的研究课题之一。经过数十年不断的研究,检测算法鲁棒性越来越强。更加令人兴奋的是近几年来,随着深度学习技术在计算机视觉领域取得了较大的突破。基于深度学习的目标检测框架已成为主流,并逐渐衍生出基于候选区域和基于回归的深度学习目标检测算法两种主要分支。以R-CNN系列为代表的基于候选区域检测方法对目标检测任务的精度有较大的提高,然而基于候选区域的检测方法存在步骤繁琐、检测速度慢等问题。因此,基于回归的检测方法直接在输入图像上回归出目标,省去了候选区域提取过程,使得检测速度达到实时效果,但是检测精度却略有下降。检测精度和检测速度始终制约着目标检测算法的实用,并且,以上两类检测框架在复杂场景下均存在易漏检问题,尤其是对小目标的检测。本文归纳总结了目标检测算法的国内外研究进展、基本研究框架以及最新研究成果。着重介绍深度学习技术在目标检测中的运用,并分析检测算法可能存在的问题。面对比较突出的小目标检测难题,本文以基于候选区域快速目标检测为核心,提出了一种新的目标检测算法,解决交通场景中的小目标检测问题。本文完成的主要工作如下:(1)Faster R-CNN作为深度学习目标检测算法的典型代表之一,在VOC 2012测试集上的mAP达到70.4%。但其存在对小目标易漏检问题,针对这个问题,本文融合多层卷积特征图。利用低层卷积特征对小目标定位,得到更加精准的定位信息;利用高层卷积特征对中大目标进行检测。融合多层卷积特征,生成细节丰富强鲁棒性特征,有利于小目标的检测。采用在线难例样本挖掘算法进行模型参数更新,进一步加速模型收敛,解决训练样本数量不平衡问题,提高模型的泛化能力。经过改进后的Faster R-CNN检测算法的整体检测精度得到了提高,并且在一定程度上解决了小目标易漏检问题。(2)精度的提高往往以检测速度减低为代价,实时的检测算法精度却不高。针对目标检测算法需要实时且高精度的要求,本文提出一种兼顾检测速度和精度的目标检测算法。通过构建自右而左、自上而下的特征金字塔,对不同尺度目标对应不同尺度的检测器,同时生成细节信息丰富且语义信息丰富的特征,有利于得到更加准确的定位信息,从而提升检测算法的精度,特别是对小目标的检测能力。此外,为了达到实时检测速度,本文在融合特征图上构建目标先验,极大的减少样本搜索空间,有效提高目标检测速度。(3)本文提出的算法在自动驾驶场景KITTI数据集、PASCAL VOC 2007数据集以及PASCAL VOC 2012数据集上进行验证,并与当前主流检测算法进行实验对比。在复杂的场景中,本文算法在检测速度达到实时的前提下,提高了检测小目标的能力,并整体提高了检测精度。另外,本文算法对局部遮挡有一定的处理能力。