论文部分内容阅读
行人重识别是指在跨摄像头或跨场景情况下,基于多摄像头拍摄的行人视频数据,实现目标行人的识别与检索问题。近几年随着深度学习的快速发展及其在计算机视觉领域应用的不断加深,行人重识别的性能已经获得了极大的提升,然而,针对实际应用,行人重识别任务仍面临着极大的技术挑战:1)行人重识别模型难以泛化扩展,成为限制行人重识别实际应用的很大阻碍;2)数据集的规模不够也制约着行人重识别的进一步发展。本文基于深度学习技术,从不同层面,研究提出解决行人重识别问题的方法,具体包括:(1)针对单样本视频行人重识别面临的图像序列特征杂乱问题,结合多目标函数,提出了基于深度判别网络的行人重识别模型。在本章中主要解决了以下几个问题:1)考虑单样本视频数据集特点,每个行人只有一个图像序列数据,但其中也蕴含丰富的特征信息,如时序信息、同一行人的不同视角信息以及姿态信息等,提出了序列结合图像的混合损失函数算法用于提纯序列图像中行人的特征信息,使模型获得更好的鲁棒性;2)在模型训练阶段,采用了一种新颖的逐步学习的半监督学习采样策略,在误差可接受的范围内,逐步利用未标记数据来提升模型性能;3)为了使模型提取更具判别性的行人特征,提出了动态调整间隔的随机采样措施。实验结果表明,所提出的模型能很好解决基于视频行人重识别任务中序列图像的特征杂乱问题,同时也能解决基于半监督学习的行人重识别有效利用无标记数据的问题。(2)针对现有的行人重识别数据集过小导致模型不能充分训练,单样本数据过少导致难以训练出鲁棒性的行人重识别模型,以及有效利用未标记样本存在挑战等问题,研究提出了基于数据增广的行人重识别网络模型。在此模型中,提出了一种新的基于半监督学习的结合单样本数据和增广数据的渐进式采样算法,在对模型进行初始化时,将原始数据通过一种新颖的随机数据增广算法进行数据扩充,以此使模型获得更充分的训练,然后通过分类模型继续对未标记数据进行分类,挑选最可靠的数据及其增广数据带入新一轮模型训练中。增广数据不仅能够降低模型过拟合的概率,还可以扩充单样本数据以达到充分训练模型的目的。每一次迭代中,随着增广数据对模型训练的促进,模型引入未标记数据的准确率也逐渐提高。最终实验结果也表明,模型在每次迭代过程中,伪标签数据的准确率都有了显著提升。(3)结合行人重识别和目标检测算法,探索行人重识别在机场特定数据集上的应用。选择了机场外背景较为杂乱的监控视频以及机场内同一走廊下两个摄像头拍摄的同一行人的监控视频,视频中包含了背景变换、行人姿态变化以及视角变化等干扰因素,在测试所用数据集中,提出的结合目标检测的行人重识别算法取得了较好的效果。