论文部分内容阅读
一直以来,行人检测都是计算机视觉领域的重要研究课题之一。行人检测通过图像处理、计算机视觉相关算法以及机器学习等技术对行人进行识别和追踪。行人检测技术首先进行图像、视频的采集以及预处理,然后对行人检测和行人跟踪识别,在民用和军事等的许多领域中对行人检测技术的需求越来越多。行人识别技术在无人驾驶汽车、智能视觉监控等领域中均有重要应用。近年来,以卷积神经网络为代表的深度学习方法在目标分类和检测问题上取得了巨大成果,引起了众多研究者的关注,成为计算机视觉领域的研究热点之一基于卷积神经网络的行人检测方法已经越来越快速和准确,但大多数检测方法仍受网络深度和参数过多的影响,在低性能的计算机上运行缓慢。YOLO(You Only Look Once)实时物体检测方法是目前最先进的实时目标检测网络之一,其检测速度和准确率都有较高表现。针对低配置的计算机,论文基于YOLO模型设计了一种基于深度残差网络的快速目标检测方法,其拥有20层卷积神经网络设计,并且融合了深度残差网络的瓶颈设计,有效减少训练参数,并采用预激活机制,保证了网络性能和准确率。在上述模型基础上进一步设计了一种新的行人检测方法。首先为了降低行人误检率,采用了更深的深度残差网络模型,在此基础上针对行人在图像上横向表达较少,纵向表达相对较多的特性,增加了特征图横向特征维度,增加横向维度的表达;其次为了提高网络性能,采用了混合数据集训练,使用PASCAL VOC行人数据增强INRIA数据集训练;最后针对新的数据集使用维度聚类的方法初选了先验预测框大小。本文对基于卷积神经网络的行人检测方法进行了探索和研究,设计了一种基于深度残差网络的行人检测方法。该方法利用了行人识别的特性和深度残差网络的基本原理,并融合了联合数据集训练,维度聚类初选先验框等方法设计了新的行人检测方法。研究和实验表明,该方法在INRIA数据集上取得了比传统行人检测方法更佳的行人检测效果。