论文部分内容阅读
行人再识别,指的是在装备有多个监控摄像头的视频监控系统之下,运用模式识别以及图像处理等一系列相关技术,判断在无重叠视域的不同摄像头之下出现的行人是否是同一个人。行人再识别是智能视频监控系统的重要研究方向,可以被广泛运用于社会安全、刑侦等领域。由于拍摄图像质量低、摄像角度不统一、行人姿态各异,背景环境变化大,以及光照、遮挡等各方面因素,使得行人再识别的相关研究成为了一个极具难点和挑战性的问题。本文针对上述影响因素,提出了两个基于行人再识别问题的创新性算法。首先,本文设计了一种稀疏编码和协同编码加权融合的算法,该算法同时兼顾了图像的全局性与局部性特征。在特征提取这一步骤中,该算法从不同空间尺度上进行特征的提取与融合,从而得到更具鲁棒性的特征表达,并将特征通过投影映射到低维子空间。在相似性度量计算这步骤中,本文算法将基于字典学习的稀疏编码与协同编码采用加权的方式相融合,以此来尽量减少拍摄视角不同、光照条件、行人姿态变化等各种因素带来的影响。该算法在两个行人再识别数据集VIPeR和GRID上进行了实验验证,与其他算法的结果相比较,本文算法表现出了较为明显的提升,在VIPeR数据集上的Rankl准确率达到了 47.1%,在GRID数据集上的Rankl准确率达到了 24.8%。此外,针对行人再识别问题,本文还提出了一种基于注意力模型的深度学习算法。该方法采用端到端的方式将特征提取与相似性度量两个环节整合到一起。常见的深度学习算法往往对整张行人图片所有区域做同样的特征提取操作,本文提出的算法考虑到不同的人体区域对特征表达起到的贡献度不同,将视觉注意力机制引入模型中。该算法结合了空间注意力和通道注意力,在多层特征图上融合注意力特征,充分挖掘图像中所包含的关键信息。该算法在四个数据集Market-1501,MSMT17,CUHK03 和 DukeMTMC-reID 上的 Rank1 准确率分别达到了 89.8%,65.5%,61.2%和80.4%,实验结果验证了注意力机制的引入对于行人再识别领域的有效性。本文对行人再识别算法展开研究,提出了稀疏编码与协同编码加权融合算法以及基于注意力模型的深度学习算法两种算法,在特征提取和距离度量上都具有其创新性。本文在不同的公开数据集上做了大量仿真实验,性能相较当前该领域最佳算法有明显提升。