基于深度特征和排序优化的行人再识别研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:gongjinjie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人再识别是一项跨摄像头的行人匹配技术,其目的是在跨视域的候选行人集中检索出目标行人。由于受光照、视角、姿态以及遮挡物等因素的影响,同一行人的外观在不同监控画面下会呈现出很大的差异,这给行人再识别工作带来了巨大的挑战。本文针对行人再识别中的特征描述和重排序两个方面进行了研究,并将相关的研究成果应用在校园场景中,设计了一个行人再识别的原型系统。主要工作如下:(1)为了提高行人特征对光照和姿态变化的鲁棒性,一方面,本文利用了带色彩恢复因子的多尺度视网膜增强算法(MSRCR,Multi-Scale Retinex with Color Restoration)对原始数据进行预处理,该算法通过增强图像中亮度偏暗的区域来丰富图像局部的色彩信息。另一方面,本文通过人体关键点和仿射变换来归一化行人的姿态,并设计了一个深度神经网络模型PIF来提取行人的包含了姿态不变信息的深度特征。相比于手工设计的特征和只考虑了局部姿态对齐后的特征,该模型通过伪孪生的网络结构实现了对原始图像和姿态归一化图像的联合学习,兼顾了全局和局部的深度特征。最后通过在三个公共数据集上进行实验和分析,证明了该方法能够有效缓解光照和姿态因素对行人特征的影响,继而提高了行人特征的表现力和鲁棒性。(2)为了提高行人再识别的排名质量,本文利用了基于图像上下文信息的重排序算法对初始结果进行排序优化。并针对重排序过程中出现噪声的问题,提出了一种基于双向K近邻(K-Nearest Neighbor,KNN)的重排序算法。该算法根据样本对之间的双向KNN关系来计算杰卡德距离,并通过将该距离和初始距离进行加权融合来达到优化排序、提高排名质量的目的。最后通过在两个公共数据集上进行实验和分析,证明了该方法能够有效的降低重排序时出现噪声的概率,继而提高了行人再识别的排名质量。(3)基于上述研究,本文设计了一个校园场景下的行人再识别原型系统。该系统首先通过目标检测算法将行人的边界框从原始视频数据中提取出来。然后依次对行人的边界框进行基于MSRCR的预处理、基于姿态不变的特征提取以及相似性度量。最后利用基于双向KNN的重排序算法对获得的初始排名进行优化,并输出最终的检索结果。最后通过在校园场景下的实际应用,证明了该系统能够有效的完成对目标行人的再识别工作。
其他文献
语音习得是二语习得中不可或缺的一部分,同时也是难点之一。在不同的语音环境中,交际者会调整自己原有的言语习惯或语体,以更接近说话对象的言语或语体,从而产生语音夹带的现
土地是农民生存和发展的重要物质资源,随着城市化进程的不断加快,农业用地被依法征收后,被征地农民常常因为就业困难而因征返贫,加上征地补偿制度与社会保障制度还没有形成统
随着消费需求的转变,个性化产品越来越受到消费者的偏爱。互联网、信息技术和生产制造能力的提升,为个性化产品的生产提供了技术基础。“互联网+先进制造业”和“供应链创新
行业配置是指在个股层次上保持相对消极的态度,而在股票行业的层次上进行积极投资。行业配置的重点是向预期未来表现优秀的行业靠近,并减少预期未来表现恶化的行业在投资组合中的权重。基金市场的结构表明,资产配置依然占主导地位,大部分研究也是围绕资产配置展开,而行业配置方面的研究较少,且多集中于行业集中度方面的研究。虽然基金行业广泛认为优化基金行业配置能有效提升业绩,但真正有效的策略少之又少。基于有关行业配置
目的:ALPPS是目前临床上新兴的用来解决肝部分切除时剩余肝体积不足的一种手术方式,因其独特的增生速度而被大量临床工作者视为未来解决肝切除术临床问题的有效方法之一,而内
篇章关系识别旨在研究篇章内部论述单元(简称为“论元”)的语义逻辑关系,是自然语言处理领域中的一项重要研究任务。宾州篇章树库语料库是篇章关系识别领域的权威数据集,它根
乳业是国计民生的重要产业,是强壮中华民族营养健康的产业。随着人民生活水平的普遍提高,越来越多的人民对乳品的关注逐渐从“量”转向“质”,乳品供应链安全也成为了当前人
氧化应激会破坏机体抗氧化防御机制,造成机体氧化损伤,这也是很多疾病的发病机理。线粒体是活性氧自由基(reactive oxygen species,ROS)产生的主要场所。阿魏酸、姜黄素和谷
微结构光纤(MOF)具有灵活的结构设计和独特的导光机制,其光学特性可以通过改变内部空气孔的形状、尺寸和分布进行有效地调节,从而满足不同的实际需要。MOF内部的空气孔不仅可以
在大数据时代,每天都有海量的图片上传到互联网,为了对如此大规模图像数据进行有效的管理和检索,图像的高效自动标注显得越来越重要。图像自动标注就是利用算法使得计算机能自动为图像赋上与图像语义内容相关的关键词汇,其本质是在图像的高层语义信息和底层特征之间建立一种映射关系。传统的图像标注算法需要手动提取特征,不适应大规模的数据集,而基于深度学习的图像标注算法大多忽视了图像的多标签性,且这些算法没有考虑图像