论文部分内容阅读
行人检测与识别一直是计算机视觉领域研究热点之一,在视频安防、机器人开发、安全驾驶以及智能交通等领域都有着良好的应用前景。行人检测与识别的核心思路,就是利用计算机视觉技术对行人进行检测、跟踪等工作,在此基础上完成识别行人的身份或行为。深度学习(Deep Learning,简称DL)是近来年机器学习(Machine Learning,简称ML)领域的一个热门研究方向。在训练学习过程中,深度学习学习的是样本数据库内在的规律和特征,这些获得的规律和特征有助于对文字、声音以及图像等数据的解释。由于行人目标的特殊性、行人目标所处背景的复杂性以及摄像机拍摄位置和角度的不可预知性,给行人检测的造成了很大的困难,传统的检测算法用于行人检测都已十分困难,更不适合用于行人的识别。所以,本文引入DL中的卷积神经网络(ConvolutionalNeuralNetworks,简称CNN),进行行人检测与识别的研究与实验。本文的主要工作:(1)分析论证了 CNN用于行人检测与识别的理论基础。对当前常见的行人特征进行理论分析和实验验证,发现当前典型的几种行人特征,包括Edgelet特征、Haar特征和HOG特征,反映和表征的都是行人目标的纹理和梯度信息,而CNN对于纹理和梯度特征有很强的学习能力和表征能力。因此,我们完全可以使用CNN来自动学习行人目标的纹理和梯度特征,而不再需要人工的选择和提取。这也是本文能够引入新算法,即CNN进行行人检测与识别的理论基础。(2)基于CNN的行人目标检测研究。本文使用CNN进行行人的检测实验,该实验主要包括两个部分,建立行人检测样本库和CNN训练检测模型,实验难点在于检测模型的训练。通过实验可以发现,该方法能够有效的对行人目标进行检测。(3)基于CNN的行人目标识别研究。在行人检测的基础之上,笔者继续深入研究,将CNN用于行人的识别。该实验也主要包括三个部分,建立行人识别样本库、构建卷CNN模型以及CNN的训练识别模型。在实验中,通过实验研究了网络模型、学习率以及迭代次数等因素对检测和识别的效果产生的影响。本文通过构建CNN模型,进行行人目标检测与识别的实验研究。实验结果表明,CNN完全可以用于行人的检测与识别,其中基于本文方法训练的模型行人检测的准确率可达93%,行人识别的准确率达到97%。同时通过分组实验,发现和掌握了 CNN的模型构建、参数训练的方法,并训练得到了许多图片分类的经验参数。