基于深度学习和无监督学习的行人重识别方法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xsxt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
发展新型智慧城市是国家重要战略,以构建“城市大脑”为核心的新一代智能化设施为基础,打造安全和便捷的智慧生活。城市中海量摄像头与监控视频数据的分析和高效利用是实现新型智慧城市的核心关键之一。本文主要针对视频中最关键的行人进行重识别,即在一个非重叠视域的多摄像头网络采集的视频中,搜索匹配给定的目标行人图像,用于跨摄像头的行人分析、检索和追踪,是实现智慧城市和智能安防的核心技术,已成为计算机视觉领域的研究热点。但是,在复杂的实际场景中,视频中的行人存在遮挡、分辨率低、姿态视角差异大等问题,难以有效提取具有辨识度的特征;而且,在新场景下,获取带标注的数据需要耗费大量精力,难以实现大规模应用。因此,本文重点研究了行人重识别问题中行人图像的特征学习和利用无监督聚类方法的行人重识别技术,学习行人图像中具有区分性的特征和解决实际应用时数据标注难题,旨在建立高效可行的行人重识别方法。主要研究成果如下:(1)提出了一种基于注意力机制的多粒度特征融合行人重识别方法,用于解决行人重识别问题中行人图像的全局和局部特征的学习问题。首先,在深度学习网络中应用注意力机制,使用卷积注意力模块,同时学习通道注意力和空间注意力自适应地提取行人图像特征;然后,应用多分支网络,对行人图像同时提取全局特征、中粒度特征和细粒度特征;最后,将其多粒度特征进行融合以更好地利用行人全局和局部信息,得到最终的鲁棒性高和适应性强的行人图像特征。在Market-1501和Duke MTMC-re ID数据库上取得了较大的性能提升,表明了注意力机制和多粒度特征融合在行人图像特征学习上的有效性。(2)提出了一种基于多尺度特征融合和多任务学习的行人重识别方法,以利用行人图像的多尺度信息提高行人重识别问题的精度。首先,利用高分辨率网络HRNet对行人图像提取特征,采用并行多分支交叉的深度网络结构,既学习图像的低分辨率特征,又保留高分辨率特征;然后,在不同分辨率特征分支之间进行信息交换,并通过多尺度特征融合利用图像的多尺度信息;最后,在网络优化时,应用分类任务和度量学习任务进行多任务联合学习优化,以更好地学习特征空间映射。在Market-1501和Duke MTMC-re ID两个公开数据集上的实验证明采用HRNet网络进行多尺度特征融合和多任务学习方式在行人重识别问题上的良好性能。(3)提出了一种基于信息熵指导的层次聚类无监督行人重识别方法,用于解决行人重识别问题中行人标注数据困难的问题。首先,针对自底向上的层次聚类,应用信息熵指导的Renyi信息熵距离准则度量两个类簇之间的距离,在类簇合并时,选择合并Renyi信息熵距离最小的类簇,以充分利用每个类簇中数据的信息;然后,引入中心损失,度量类内元素与聚类中心的距离,以使同类数据更加聚合。最后,迭代进行层次聚类过程和特征提取过程以优化。在Market-1501和Duke MTMC-re ID数据集上进行实验,结果证明基于Renyi信息熵的距离准则和中心损失的使用对层次聚类无监督行人重识别方法提升显著。
其他文献
随着通信电子产业的迅猛发展,无线终端相关的电子产品日渐增多,无线能量传输逐渐成为相关领域的研究热点。实现无线能量传输的具体方式主要有感应式、耦合谐振式以及电波辐射式三种,其中电波辐射式无线能量传输技术以传输距离相对较远等优势成为最有研究价值的方向。现今,无线能量传输效率一直很低,在众多原因当中,很大一部分原因是由于接收端的整流电路效率低下引起的,而在整流电路当中最核心的整流器件就是整流二极管。通常
我国经济已经从高速增长阶段转向高质量发展阶段,经济增长不仅要看速度,更要看质量。但我国上市公司普遍存在的非效率投资现象,严重制约了企业间资源配置效率、企业资本结构调整与企业价值增长。投资效率是提升企业价值的重要因素之一,然而由于受委托代理问题、信息不对称、管理者过度自信等因素的影响,企业管理者往往很难做出正确的投资决策,导致非效率投资。因此研究影响企业非效率投资行为的因素及其相关性,对于企业完善资
针对目前内镶迷宫滴头滴灌带生产过程中存在的打孔质量不稳定且普遍采用人工检测的现状,将机器视觉技术应用到滴灌带生产中。通过工业相机采集现场图像并进行一系列的图像分析与处理,识别、测量得出滴孔的位置偏差。然后将位置偏差反馈给控制器并控制打孔机进行调整,从而使系统形成闭环,实现滴孔加工位置的在线检测与反馈调节。在对检测系统进行总体结构和工作流程设计后,对机器视觉模块进行硬件的选型与安装。然后重点对基于机
随着城市化进程的快速发展,农村人口急剧减少,产业发展水平滞后,传统文化流失。根据国家政策和地区发展要求,对于具有文化特色和农业基础的贫困乡村,发展乡村旅游成为提升当地社会经济水平的重要手段。通过乡村旅游景观规划设计,优化重组农业产业结构,深度挖掘当地传统文化,保护生态可持续发展,打造特色乡村旅游主题,带动当地旅游经济和农民收益。本文通过文献综述法、实地考察法、归纳总结法、综合分析法,在大量查阅了国
为了更深入地理解视觉世界,计算机不仅需要检测出复杂场景中的单个目标,还要对目标间的关系进行推理。在各种视觉关系中,我们最关注的是场景中的人与其他物体间的关系。人物交互(Human-Object Interaction,HOI)检测是用于判断人与物体间的交互行为的计算机视觉任务,具有巨大的实际应用价值和潜力。HOI检测通常被理解为检测三元组<人、动词、物>,在检测出人和物体的基础上,对候
计算机视觉是人工智能领域重要的研究方向之一,而作为计算机视觉主要分支的目标跟踪技术受到国内外学者的重视。传统的目标跟踪算法主要利用相关滤波方法处理手工设计的低维目标特征实现跟踪。然而,由于手工特征不能从本质上刻画目标,因此会导致跟踪性能受到限制。深度学习技术可以将低层特征组合成抽象的高层特征,从而克服手工特征表征不足的问题。目前,基于深度学习的目标跟踪算法大都是使用卷积神经网络来研究这一问题。这类
如今的信息化时代,大量的信息通过数据的形式存储在个人或企业的硬件设备中,用何种技术保护信息的安全成为一个核心话题。虹膜识别具有高唯一性、强稳定性和非侵犯性等特点,使其成为最安全、最稳定的识别技术之一,担起了保护信息的重任,因此成为了重要的研究方向之一。该文将卷积神经网络应用到虹膜识别中,对虹膜图像做分类任务,用于人员的身份识别,并针对传统的卷积神经网络在虹膜识别研究中存在的过拟合及识别不稳定问题做
随着信息技术的发展,病历逐渐从纸质病历演变到电子病历,患者的医疗信息也随即转向信息化存储。在传统的医疗信息存储系统中,各个医疗机构之间的医疗信息存储无法做到共享患者的医疗信息,出现了“数据孤岛”的现象,不便于患者个人掌握病史。与此同时,传统医疗信息存储系统无法记录下对医疗信息的访问记录,存在隐私泄露的可能。区块链是一种分布式账本,可以用于存储患者医疗信息,并记录下对患者医疗信息的访问记录,可以帮助
在现代战争中,侦察设备的隐蔽性十分关键,无源定位技术的出现给传统的定位方式带来了新的思路,可以不主动发射电磁波就可以实现目标位置确定。分布式无源定位意味着多个测量站协同工作,通过静默地接收辐射源电磁波来发现目标位置,达到定位的目的。分布式无源定位技术应用范围十分广泛,在电子侦察与对抗领域有着重要的地位。分布式无源定位系统中可以使用的定位技术有很多,例如测角定位、测时差定位、频差、相位差定位以及混合
本文通过分析园林施工企业造价管理现状流程和管理过程存在的问题,提出了园林工程实施阶段造价管理研究的必要性。通过分析项目实施过程不同阶段造价管理的内容,明确各阶段造价管理的要点,并在此基础上构建园林施工企业全过程工程造价管理体系,设计了全过程工程造价管理体系系统图。从工程投标到工程交接,进行了全过程工程造价管理体系六个实施过程管理策略研究:采用一元线性回归法与市场询价相结合的投标阶段成本测算的方法,