面向复杂场景中鲁棒特征提取的行人再识别研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:caozhi7963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人再识别是智能监控研究的重点之一,它是利用计算机视觉相关技术,判断不同摄像头间非重叠区域是否存在同个行人,进而可实现可疑人物的快速检索、预测异常事件等相关分析。然而在实际应用场景中,由于存在光照变化、背景杂乱、行人姿态多样以及遮挡等问题,行人再识别研究存在诸多挑战,引起学术界和工业界广泛关注。如何提取更鲁棒且可区分度高的行人特征以提高行人的识别效果,成为该课题的研究核心之一。利用手工设计得到的特征难以消除上述问题带来的影响,而近年来研究发现,采用卷积神经网络能提取辨别性更强的图像特征,将其用于行人再识别效果也有显著提升。本文从人类视觉观察规律和学习知识方式中受到启发,基于注意力机制和课程学习策略探索行人再识别中有效特征的提取。首先,网络模型结合注意力机制以一种有监督的方式生成注意力映射,将该注意力映射作用于全局分支与局部分支,兼顾全局信息与局部信息,利用局部特征强化全局中重要区域,也利用全局信息为局部信息提供上下文关联;其次,用密度分布情况定义复杂度,以此重新划分数据集,利用课程学习策略由易到难训练模型,以渐进式多阶段训练方式逐渐提升网络性能。通过在行人再识别三大公开数据集的实验验证,所提方法可实现复杂场景中行人鲁棒性特征的提取,相比于目前性能较优的行人再识别方法,性能均有提升。尤其对最具挑战的大型数据集MSMT17,本文方法优于现有方法,Rank-1和m AP分别提高9.1%和14.6%。最后,利用机器人平台验证所提方法在实际场景中的有效性。
其他文献
随着基于图像引导的术中导航技术的不断发展,不同模态的医学图像配准技术在心脏介入手术中发挥着越来越关键的作用。术前CT和术中超声的配准可以帮助手术医生诊断患者的病情,更好地进行介入手术。本研究在深入了解不同模态医学图像配准的研究现状的基础上,针对传统的配准方法的优点和缺陷,提出了具有创新性的CT与超声的配准方法,与电磁导航系统相结合,用于心血管介入手术的术中引导。本研究的配准方法主要分为三个阶段。首
比特币,承载对中心化节点的不信任,在金融危机中诞生。贯彻比特币思想的一众加密货币(不包含瑞波币等),核心意愿是一方面以共同维护账本代替中心对支付数据不可见的存储与处理,另一方面将铸币权依去中心化程度不同分散到不同数量的参与者。工作量证明(Po W)作为占据主导的一种共识协议,设计愿景能够实现较高程度的去中心化,但由于参与者获得稳定收益的诉求,自发组成矿池,导致了算力的中心化;不诚实参与者对协议的多
在传统设计施工模式中,基于平法施工图进行配筋信息表达,具有几何信息不明确,信息数据难以协同共享等局限性。通过BIM技术,可以有效弥补上述不足,减少材料浪费和工期延误等问题。然而BIM应用过程中,由于各方数据标准的私有性,其钢筋数据信息难以协同共享。目前,依靠人工翻模或数据接口的数据交互模式,其效率低下,费用高昂,且不可避免存在数据丢失或误差。因此,基于一种通用的数据标准,提取结构设计阶段的配筋数据
智能门锁系统是智能家居的一重环节,是提高家庭、宾馆和办公室等场所安全、管理效率的有效措施。据此,论文研究、设计并实现了一套面向B端市场(公租房、酒店和企业办公等)的智能门锁系统,该系统具有多元鉴权认证、视频监控、云端集群管控、移动端应急处理与无线升级等功能。此外,为了保障信息安全,论文提出了一种针对本系统改进的嵌入式终端信息传输加密方案。首先,信息传输加密层面:论文选用SM4+CTR对称加密算法,
人体目标的身份识别是无人商店应用场景中的一个重要环节,从用户入店时的身份验证,再到店内的用户身份识别,需要同时保证识别的实时性和准确性。首先,相对于传统的目标检测与跟踪的解决思路,借鉴“仅看一眼就知道目标分类”的YOLO目标检测思想,以YOLO算法和图像特征识别算法为基础,提出了“仅看一眼就知道是谁”的研究思路,设计了室内监控对象身份识别模型。其次,对VOC数据集进行重新标注,使得标注后的数据集包
随着硬件设备、网络传输的不断发展,多媒体内容已经成为我们日常生活的重要组成部分,人们可以随时随地通过各种便携式显示设备观看图像/视频。图像/视频内容通常是在考虑特定目标分辨率的情况下制作的,而不同的显示设备往往没有统一的长宽比。图像/视频重定向技术就是将图像/视频适配到目标屏幕上进行更好的播放。但是目前所广泛采用的朴素的重定向方法缺乏了对图像/视频内容特性的考虑,都有着不同的本质上的缺陷。因此,基
对于图像去噪问题的研究长期以来都在计算机视觉领域中占据十分重要的地位,这是因为基础图像的质量将在很大程度上制约后续图像信息处理的效果。图像噪声的类型多种多样,而高斯噪声的特性使其成为图像去噪算法研究中最为核心的一种,本文的研究重点也正是图像的高斯去噪问题。过去传统的图像高斯去噪方法建立在图像先验知识模型的基础上,这依赖人的经验,可能导致在建模的过程中难以利用到图像的一些高级特征,存在一定的局限性。
随着VR技术的发展,VR游戏逐渐盛行,线下出现了一批VR体验店、VR自助机,同时也有越来越多的VR游戏爱好者,入手VR设备开启VR游戏。游戏发展到一定阶段也往往伴随着游戏平台客户端的产生,但是当前VR游戏市场不健全,玩家挑选游戏耗时费力,VR游戏运行需要安装各类插件,入手难度高;以及账号过多难以管理,游戏的下载、安装更新比较繁琐,这时一款合适的VR游戏平台客户端显得尤为重要。国内VR游戏客户端如造
近年来,目标检测在智能安防、智慧城市、智能工厂、智能汽车等多个领域应用广泛。由于目标检测的核心技术是深度学习,所以目前大多数的目标检测模型部署在服务器端,但这种方式存在两个弊端:一是随着部署的需求量骤增,大量配置高性能服务器在经济上会造成巨大压力;二是摄像机等边缘设备采集的待检测数据需要经过网络传输才能到达服务器,当数据量非常庞大时会影响到检测的时效性。随着边缘设备的日渐流行,其小体积、高性价比、
自人工智能技术发展以来,各领域都在寻找有利的结合点,最近几年,人工智能技术也不断涌现出与医疗领域结合的趋势,同时大量的数据资源、快速的计算能力、算法的不断优化等基础准备的成熟与创新也成为发展医学领域智能化技术的重要基石。在这种趋势下,我国医疗智能化的发展面临着前所未有的机遇和挑战,图像和语音技术的成熟为医疗行业带来新的机遇,但是由于语言的复杂性使得自然语言处理在医疗领域的应用仍然面临着诸多挑战。例