论文部分内容阅读
行人重识别的主要内容为在不同摄像头下进行同一行人的匹配,其广泛地应用于智能监控、社会安防以及刑事案件侦破等领域。由于监控场景中存在的光照变化、行人姿态变化等因素,使得行人重识别成为计算机视觉领域中最具挑战性的研究课题之一。目前行人重识别的研究大多是基于框好的行人图像,而实际场景下的图像应该是包含其他行人和背景物体的完整图片,其中未知的干扰更多且识别难度更高。并且目前主要研究思路是将行人检测与行人重识别分成独立的两个任务,因此行人检测输出行人框的质量会直接影响到行人重识别的准确率。基于以上两点本文旨在针对实际场景下行人重识别的应用,将行人检测融合到行人重识别网络中进行联合学习,在训练过程中两个不同的任务相互协同与促进。本文的主要研究工作如下:(1)分析现有行人重识别方法的基本原理,指出目前大多行人重识别方法在实际场景下应用的缺陷。本文基于真实场景下的应用,利用Faster R-CNN检测框架将行人检测融入到行人重识别网络中实现端到端学习,减少特征复用,网络计算速度和精度显著提高。(2)考虑到在实际监控场景下数据是视频形式的情况,在现有框架的基础上提出一种结合视频序列帧间信息的行人检测方法。在当前帧图像进行检测时将上一帧图像检测结果放入网络中,并赋予一个较高置信度使得网络重点检测该区域,在解决遮挡、背景干扰等问题时鲁棒性更强,并加入Soft-NMS(Soft Non-Maximum Suppression)提升了算法解决严重遮挡问题的能力。(3)针对在行人重识别中融合行人检测后产生的多尺度匹配问题,提出一种基于自适应特征金字塔(Adaptive Feature Pyramid)的行人重识别方法。首先验证了特征金字塔在解决行人重识别多尺度匹配问题的有效性,指出在特征金字塔中低层特征损害高层特征的表达导致识别效果不显著。通过学习一组调整向量来改变低层特征分布,显著提高了行人重识别在多尺度匹配时的准确度。(4)利用Caffe+PyQt+MySQL等工具实现了一个行人重识别智能视频监控平台,在真实监控场景下分别实现了离线和在线行人重识别,测试结果表明本文的算法具有较高的准确度和较强的抗干扰能力。