论文部分内容阅读
公共安全是国民经济发展和社会稳定的前提,随着监控设备的普及,在城市视频监控系统中,每天产生海量的监控数据。对监控数据进行自动地分析,将为公共安全和刑事案件侦查提供有力的技术支撑。在不同监控摄像头下的跨场景行人检索问题,即:行人再识别,已成为公共安全领域中一项新的且具有挑战性的研究课题。本文研究基于深度学习的行人再识别方法,围绕着三个问题,开展了相关的研究工作,创新成果如下:
(1)针对公共安全中跨场景行人再识别的效率问题,以快速、准确地从候选数据集中检索到感兴趣的行人为目标,本文提出一种基于图像局部区域深度哈希的行人再识别方法。通过对通用的深度哈希模型中卷积层所产生的特征图进行分析,用局部区域代替整幅行人图像作为网络的输入,使得行人图像中所关注的部位增多,更加准确细致地对行人进行描述。通过设计基于局部区域深度哈希模型,映射行人图像的特征表示到汉明空间,降低了检索和排序的时间。实验结果表明,所提出的方法在显著地提升了行人再识别效率的同时,又取得了较高的行人再识别性能,为实际应用提供了新的解决方案。
(2)针对行人再识别数据集中行人标注量小,在深度学习模型的训练过程中,带来较高的“过拟合”风险的问题和训练过程不够充分的问题,本文提出两种解决方案,分别是:1)提出一种基于“伪正样本”正则化深度模型的行人再识别方法,利用大量存在的无监督数据来生成“伪正样本”,增强原始训练集中样本的多样性,降低“过拟合”风险;2)提出一种基于两路互补对称结构深度模型的行人再识别方法,通过对深度学习模型的结构进行改进,将相同行人的两个样本同时作为输入,在有限的训练集上,使得深度学习模型的训练过程更加充分。在公开的行人再识别数据集上进行了实验,实验结果验证了上述方法的有效性,并取得了较高的行人再识别性能。
(3)针对行人再识别数据集中训练样本“类内”的变化明显和复杂的背景干扰等影响深度学习模型鲁棒性的问题,本文提出两种解决方案,分别是:1)利用基于损失函数联合的策略,在深度学习模型训练过程中,通过约束“类内”样本的关系,减小了样本的“类内”差异;2)提出一种基于显著性图像融合深度模型的行人再识别方法,通过对生成的基于行人的显著性图像和与其对应的原始行人图像进行融合,克服背景干扰,获得了更加鲁棒的深度学习模型。在公开的行人再识别数据集上进行了实验,实验结果验证了上述方法的有效性,并取得了较高的行人再识别性能。
(1)针对公共安全中跨场景行人再识别的效率问题,以快速、准确地从候选数据集中检索到感兴趣的行人为目标,本文提出一种基于图像局部区域深度哈希的行人再识别方法。通过对通用的深度哈希模型中卷积层所产生的特征图进行分析,用局部区域代替整幅行人图像作为网络的输入,使得行人图像中所关注的部位增多,更加准确细致地对行人进行描述。通过设计基于局部区域深度哈希模型,映射行人图像的特征表示到汉明空间,降低了检索和排序的时间。实验结果表明,所提出的方法在显著地提升了行人再识别效率的同时,又取得了较高的行人再识别性能,为实际应用提供了新的解决方案。
(2)针对行人再识别数据集中行人标注量小,在深度学习模型的训练过程中,带来较高的“过拟合”风险的问题和训练过程不够充分的问题,本文提出两种解决方案,分别是:1)提出一种基于“伪正样本”正则化深度模型的行人再识别方法,利用大量存在的无监督数据来生成“伪正样本”,增强原始训练集中样本的多样性,降低“过拟合”风险;2)提出一种基于两路互补对称结构深度模型的行人再识别方法,通过对深度学习模型的结构进行改进,将相同行人的两个样本同时作为输入,在有限的训练集上,使得深度学习模型的训练过程更加充分。在公开的行人再识别数据集上进行了实验,实验结果验证了上述方法的有效性,并取得了较高的行人再识别性能。
(3)针对行人再识别数据集中训练样本“类内”的变化明显和复杂的背景干扰等影响深度学习模型鲁棒性的问题,本文提出两种解决方案,分别是:1)利用基于损失函数联合的策略,在深度学习模型训练过程中,通过约束“类内”样本的关系,减小了样本的“类内”差异;2)提出一种基于显著性图像融合深度模型的行人再识别方法,通过对生成的基于行人的显著性图像和与其对应的原始行人图像进行融合,克服背景干扰,获得了更加鲁棒的深度学习模型。在公开的行人再识别数据集上进行了实验,实验结果验证了上述方法的有效性,并取得了较高的行人再识别性能。