论文部分内容阅读
近年来,随着安全城市建设步伐的不断加快,监控摄像头的数量呈爆炸式增长。面对海量的视频数据,传统的人工处理方式显得既笨拙又低效率。因此,为了解决跨摄像头行人识别、追踪与检索问题,行人重识别技术被提出。行人重识别能够在庞大的视频监控网络中对指定目标行人进行检索与识别,并通过建立不同摄像机下目标行人的身份关联信息,实现目标行人的跟踪与运动分析等。然而在现实应用场景中,由于光照、相机视角、行人姿势的不同使得同一个行人在不同摄像机下往往呈现出不同的状态,给行人重识别问题的研究与应用带来了巨大的挑战。本文在分析与研究国内外前人工作的基础上,针对光照、相机视角以及行人姿势变化等问题对行人重识别带来的影响,提出了2种基于深度学习的解决方案,并通过与前人的工作进行对比验证了本文方法的有效性。具体内容如下:(1)提出了一种基于特征融合与深度集成网络的行人重识别从特征提取方面,FF-DEN不仅考虑了CNN全局特征的鲁棒性,还考虑了LOMO特征的局部显著性。从网络模型结构方面,FF-DEN即充分考虑了图像之间的相似性(用于度量函数的学习),又充分利用了图像的类别信息,并且使用交叉熵损失函数建立所有图像之间的内在关系。因此,能够提取出具有辨别力的鲁棒性特征,从而提高行人重识别的准确率。(2)提出了一种基于多层语义特征的视觉注意力网络行人重识别VAN-MSF网络以三张(Anchor/Postive/Negative)行人图像作为输入,首先使用Feature Fusion Network提取行人图像的多层语义特征,然后使用Visual Attention Network在多层语义特征的基础上学习行人图像的显著性局部特征,最后将显著性局部特征与多层语义特征进行有效融合作为行人图像最终的特征表示,并采用Triplet Loss+CrossEntropy Loss多任务学习方式对网络参数进行优化。(3)构建了一种端到端的行人重识别原型系统在第三、四两章的工作基础上,提出了一种基于端到端的行人重识别网络模型,该网络模型将行人检测与行人重识别网络进行整合,并对两个网络进行级联操作达到同时训练与优化的目的,从而实现视频监控网络下的行人自动检测与识别。并在此基础上,构建了一种基于C/S模式的端到端行人重识别原型系统,在Windows环境下使用MyEclipse工具、Java语言对该系统的相关功能进行开发与实现。本文通过实验对FF-DEN与VAN-MSF网络模型的性能进行了评估,并与当前流行的算法进行了对比。实验结果表明,两种网络模型的拟合速度较快具有较高的rank1和mAP精度,证明了本文算法的有效性。