论文部分内容阅读
行人再识别是关于在非重叠的不同摄像机视角下识别匹配同一行人问题的研究。行人再识别技术主要应用于视频监控与刑侦破案中,它在计算机视觉和公共安全领域中具有重要的学术意义和应用价值。由于当前视频大数据的快速发展与智能视频分析技术的迫切需要,所以本文结合多级深度表示学习,重点研究基于视频的行人再识别技术。从阶段式模型和端到端学习模型两个角度创新地提出两种方法,有效提高行人再识别的准确率。从基于深度特征表示和距离测度融合的阶段式模型的角度,针对目前视频行人再识别中存在行人外观与行为相似,以及多特征表示行人时相同行人在不同特征下距离的差异性而导致匹配不正确的问题,本文提出一种联合多级深度特征表示网络和有序加权距离测度融合的算法。在行人特征表示阶段,所提出的行人多级深度特征表示网络不仅能学习视频序列中行人的时空特征,还能获取行人的全局外观特征和局部外观特征。在有序加权距离融合阶段,本文将行人的特征表示分别输入到距离测度学习中,计算行人在三类特征下的独立距离,并将距离排序后,根据距离的排名优化距离权值。最后融合三类距离得到最终距离,从而准确匹配行人。通过在两个公共数据集中与相关方法对比后的实验表明,本文算法不仅提高视频行人再识别的识别率,还具有丰富和完整的行人特征表示能力。从基于混合深度特征和双流Siamese网络的端到端模型的角度,围绕如何建立一个能消除视频中行人干扰帧影响的稳定行人外观特征表示模型和如何有效地利用视频中的外观特征与时间特征两种互补信息来计算行人之间的相似程度两方面重点问题,本文提出了一种混合深度外观-时间特征的端到端学习的视频行人再识别架构。该端到端的深度学习架构由混合深度特征结构和双流Siamese网络组成,其能够学习行人关键帧的外观特征,视频行人的时间特征以及不同特征的独立距离的测度相似性。在三个公共数据集的大量实验结果表明,本文算法架构不仅提高行人特征的表征能力,还使所提出算法的识别率优于相关的先进算法。