论文部分内容阅读
行人检测属于计算机视觉和目标检测领域的一个重要研究方向。相关研究成果在智能监控、智能交通、车辆辅助驾驶等具体场景中进行了大量的应用。由于在复杂场景下存在光照不均、遮挡、噪声干扰大等因素,目前行人检测算法在实际场景的应用中仍面临检测率低、对小目标不敏感等挑战。本文在卷积神经网络基础上构建速度更快、精度更高的行人检测算法,为复杂场景下的行人检测提供了新的方法。首先,本文对国内外行人检测算法的研究现状进行了详细介绍,指出和分析了目前行人检测任务面临的主要难点。同时介绍了基于人工特征表示与分类器结合的方法和现有基于深度学习的行人检测方法各自的优缺点。对行人检测算法常用的数据集和评估标准进行了介绍。其次,本文在基于深度学习的Faster RCNN算法基础上,根据行人数据集的特点对其进行相应改进。针对多尺度行人目标,利用三种不同尺寸的滑动窗来生成候选区域从而获得更好的感受野。通过特征拼接的方法对卷积网络中浅层细节特征和深层高语义特征进行特征融合,从而提高系统对多尺度目标的检测能力。最后在开源深度学习框架中对该算法在VOC 2007数据集上进行了实验。实验结果表明,本文在Faster RCNN基础上进行的改进措施能够有效提高行人检测系统在相关数据集中的检测能力。最后,针对基于交通场景下的车载视频Caltech数据集特点对Faster RCNN算法进行相应改进,由于行人检测任务本质是个二分类的问题,本文分类时的全连接层输出神经元个数仅为2048,从而减少了系统过拟合。为了更好的适应Caltech数据集中行人的长宽比特点,采用的区域池化后的特征长宽分别为8×4。为了提高网络的检测能力,本文增加了候选窗口周围上下文环境池化的区域池化方式。在Caltech数据集上的实验结表明,本文改进后的方法可以实现更高的检测精度。