论文部分内容阅读
近年来,随着社会的发展以及人们对于公共安全的关注,越来越多的监控设备被部署于全球的各大城市。在刑事案件破获,失踪人口搜寻,城市安全管理和社会稳定方面有着非常重要的作用。同时伴随着海量的视频数据,利用计算机对监控设备采集到的视频图像数据进行智能化分析处理的需求与日俱增。行人重识别(Person Re-identification)作为一种重要的智能视频分析技术,其旨在判断不同摄像头下的行人图像是否为同一目标行人,因此受到了国内外科研工作者的广泛关注。然而现有的大多数基于深度学习行人重识别方法主要是在裁剪好的行人图片中匹配查询集和候选集,这与实际应用时面对的全景图差异较大。针对行人重识别目前所存在的问题,本文主要完成了以下三个方面的工作内容:1)在行人重识别的实际应用中,如果对候选图中的所有行人进行手工裁剪,那将会耗费大量的人力,因此使用行人检测算法成为了必然。而在之前的许多工作中人们都是将行人检测和行人重识别分成了两个独立的研究部分。本文为了在提高行人检测精度的同时还能获得更好的重识别率,提出了一种基于行人检测的一体化行人重识别框架。将行人检测和行人重识别两部分整合到了同一个深度卷积神经网络上,真正意义上的实现了端到端的训练。同时本文还对Faster R-CNN目标检测网络中的锚点(Anchors)做了改进,并在模型训练时使用了新的损失函数。相比其他算法,本文的方法在两个行人数据集上都获得了较好的性能提升。2)行人重识别和人物属性识别的共同目标是都是对行人进行描述,只是行人重识别会提取一个人的全局特征而属性识别则更注重于局部特征。考虑到两者的异同,本文提出了一种多任务行人重识别框架。在网络结构的实现上,本文在一体化行人重识别框架的基础上添加了额外的人物属性识别分支网络,实现了不同任务之间的参数共享,有效的降低了模型的计算量,提取的特征也更有助于提升行人重识别的准确率。同时在行人的重识别的过程中为了更好地综合利用行人图像的多尺度信息,本文将行人的属性特征和身份ID特征进行了特征融合。实验结果证明了本文提出的方法,能够学习到更具表达性和鲁棒性的行人特征,可以有效地提高行人重识别的效果。3)由于本文的研究内容都是针对现实场景图片的,并且还会利用到人物属性,因此在PRW和SSM这两个大型的行人数据集上,我们根据视觉内容对所有图片中的每一个行人都标注了11维人物属性。