论文部分内容阅读
行人检测是计算机视觉方向一个非常重要的研究课题,在智能视频监控、车辆辅助驾驶和行人动作分析等方面发挥着至关重要的作用。由于光线强弱变化、行人姿态迥异、行人间相互遮挡、尺寸不一和拍摄角度的不同,加上行人检测对精度和实时性的要求较高,使行人检测成为人工智能领域的研究热门之一。 本文研究了行人检测的一些主流算法,受这些主流算法的启发,做出了改进,提出了三种新的行人检测方法,并通过实验验证了所提算法的性能优势。本文的主要贡献如下: (1)对当前国内外行人检测的经典算法和研究现状做了大致介绍,对研究过程中出现的问题做了分析。同时详细介绍了行人检测的具体流程和涉及的一些关键技术。 (2)提出一种Subset-Haar-like中间层特征的行人检测方法。该算法采用7种Haar-like特征模板对ACF特征的10个通道,进行卷积操作,生成Subset-Haar-like中间层特征(目标特征),并结合基于决策树弱分类器的软级联框架的Adaboost分类器,形成一套完整的行人检测算法。在Inria和Caltech公开行人数据集上进行实验,验证了该算法的有效性。 (3)提出一种LFDA加权Subset-Haar-like中间层特征的行人检测方法。该算法是对Subset-Haar-like中间层特征加权组合,并使用LFDA算法学习其加权系数。实验证明该算法在保持检测准确率的同时,显著降低了漏检率。 (4)提出一种LFDA加权Subset-Haar-like检测器与ResNet残差网络融合的行人检测算法。该算法是用LFDA加权Subset-Haar-like中间层特征模型Ours2(LFDA),对Inria(Caltech)数据集训练正样本图片进行检测,分别裁剪IoU大于Thr_pos(正阈值)和小于Thr_neg(负阈值)的检测框图片作为ResNet残差网络的训练正负样本,并对正样本检测框在裁剪前进行填充(padding10%)操作,此外裁剪Inria(Caltech)训练集的真值(ground truth)图片也作为ResNet残差网络的训练正样本,将这些图片送入预训练好的ResNet152网络模型训练微调,生成最终模型,剔除Ours2(LFDA)模型中误检的非行人检测框。实验证明了该算法的有效性。