论文部分内容阅读
近年来,随着深度学习技术的日渐成熟以及广大学者创新性的应用研究,计算机视觉领域相关任务的性能都得到了大幅度的提升,在目标检测任务中的表现尤为如此。而且,行人检测作为目标检测的子任务,一些主流的目标检测方同样适用于行人检测任务。当前,基于深度卷积特征的行人检测器的研究已经成为当前最热门的研究方向之一。本文通过对主流的一阶段和两阶段行人检测器进行详细地研究后,在一阶段检测器模型的基础上提出了两种改进后的行人检测模型——增强的SSD行人检测模型和多步级联行人检测模型。这些模型不仅能够提升基准检测精度,而且能够保持实时的检测速度。针对一阶段检测器在小规模行人目标场景下检测不佳以及无法处理密集行人场景的问题,本文提出了几个改进策略。首先,在SSD的基础特征提取网络上采用密集连接的策略,将浅层特征与目标特征进行融合,使得目标特征中能够包含更多的低层次信息。然后,在训练过程中利用细粒度的采样策略来生成全局的先验框,并提出一种衡量全局先验框质量的TMMR指标。实验证明,采用该策略后,整个训练集中几乎所有的训练目标都能够与对应的先验相互匹配,从而有效的提升训练过程中的正样本的数目,进一步的提升了对行人目标的检测精度。最后,通过设计一种额外损失策略,使得训练数据和检测网络得到了充分的训练拟合,在一定程度上解决密集场景下行人目标出现大量漏检的问题。受渐进拟合定位检测模型的启发,对两阶段检测器能够具有较高检测精度的原因进行了研究,并在改进后的一阶段检测模型上创新性的添加了多阶段级联检测模块,使得一阶段检测器能够在实时的检测速度下实现检测精度的提升。多阶段级联检测器由基础网络和多阶段级联检测模块组成。首先,在优化后的基础网络上提取多尺度目标特征。然后上在每一种特征上进行多次的检测,而且每一种特征上的检测方案都会反馈给后续的检测步骤。后续的检测过程将检测方案与全局先验进行融合,产生更多数目的正样本数据,从而在检测过程中得到更加精确的检测结果。通过PRW、Caltech以及VOC行人数据集上的相关对比实验,可以证明改进后的行人检测算法确实达到了预期的检测效果。