论文部分内容阅读
因为行人检测是车辆辅助驾驶、智能视频监控和人体行为分析等应用中的第一步,所以行人检测一直是计算机视觉中的研究热点。由于行人是一个多自由度非刚性体的对象,外观易受穿着、姿态、遮挡、视角以及照明等影响,如何有效的检测行人仍是具有挑战性的课题。目前行人检测技术中最常用的方法是基于统计分类的检测方法,该方法的核心任务是合理的选择特征和分类器训练算法。特征应具有这样的性质:来自同一类别的不同样本的特征值应该非常相近,而来自不同类别的样本的特征值应该有很大的差异。分类器要有很好的学习和泛化能力,能够得到全局最优解。基于统计分类的检测方法首先对样本进行特征提取,再利用机器学习的方法从大量特征中选择出能够有效描述行人的特征,并训练出相应的分类器,最后利用该分类器进行检测,这也是本文采用的方法。本文详细介绍了图像的相位一致性特征(Phase Congruency feature),并将其应用到了行人检测中,相位一致性特征描述的是行人的轮廓信息。为了更有效的描述行人特征,本文还提取了行人图像的局部二值模式算子(LBP)特征,LBP特征表征了行人图像的纹理特征。本文将相位一致性特征和LBP特征相结合,从而使算法既能描述行人的整体特征,也能够描述行人的细节特征。在分类器的选择上,我们使用支持向量机(SVM)进行分类,SVM是基于结构风险最小化准则的新型机器学习算法,对小样本问题具有很好的学习与泛化能力。另外,由于支持向量机算法是一个凸优化问题,因此局部最优解一定是全局最优解,可以防止过学习。在对大尺度图片进行检测时,我们选择对检测窗口进行缩放,并将窗口在图片上滑动,遍历整幅图片。一个人体目标一般会产生多个检测结果,针对这个情况,本文将所有的检测结果进行融合,得到最终结果。为了验证新方法的性能,本文做了大量的对比实验,实验结果表明,本文提出的基于多特征的行人检测算法在检测速度和检测精度上都有一定的提升,能够很大程度上适应行人多样的姿态和所处的复杂的背景。这为以后的研究工作打下了良好的基础。