基于图卷积网络和注意力机制的行人再识别研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户：fxqq

【摘要】

：

【作者】

：

张晶晶

【机构】

：

合肥工业大学

【出处】

：

合肥工业大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着人们社会安防意识的提高,智能监控系统在世界各地被广泛的部署和应用。行人再识别作为该系统中基础且核心的技术之一,其目的是从非重叠相机视域中捕获的一组图像中检索出感兴趣的行人。行人再识别技术在智慧安防、智能零售和刑侦调查等领域中较高的应用价值,已经引起了学术研究界和工业界的高度重视。然而,面对复杂的实际监控环境,现有的行人再识别技术仍面临着诸多挑战。一方面随着昼夜光线的变化,摄像机在白天捕获可见光图像在晚上捕获红外图像,由此产生两种具有不同性质的模态图像。另一方面从摄像机中提取的行人图片都是不带标注信息的,通过人工完成大量数据标注的工作耗时且繁琐。针对以上两种真实场景,本文分别提出使用图卷积网络和反事实注意力学习方法来解决跨模态和无监督域自适应行人再识别问题。本文的主要研究内容如下:1.针对跨模态行人再识别,本文提出一种新颖的基于全局-局部图卷积网络的方法,通过使用图卷积网络对潜在关系进行建模,学习不同模态下行人图像的判别性特征表示。其中,全局图模块通过图卷积网络建立两种模态下同一身份行人的上下文关系,学习模态间的共性特征,提高两种模态下相同行人图像的相似度。局部图模块是利用图卷积网络建立每个行人不同身体部位间的内在关系图,提取更具判别性的局部特征表示。在两个公开跨模态数据集上的实验数据证明,该方法有效提高了跨模态行人再识别的检索性能。2.针对无监督域自适应行人再识别,本文设计一个新颖的基于反事实注意力学习网络,通过衡量注意力学习的质量对训练过程进行指导优化,促使模型关注更加精准的注意力特征,减少噪声伪标签的生成;其次使用平均教师方法估计教师模型和学生模型输出特征的不一致性,作为目标域行人样本的不确定性分布,通过修正不确定样本进一步提高目标域的识别性能。该方法在多个公开数据集上优异的表现验证了其可以有效提升无监督域自适应行人再识别的性能。

其他文献

基于图嵌入的多变量时间序列聚类研究

多变量时间序列（MTS:multivariate time series）数据是多个变量在一段时间内按照一定时间间隔记录的观测值数据。MTS聚类可以在缺乏先验知识的情况下将样本划分成有意义的簇,是一种广泛应用于金融分析、流量预测、临床诊断等领域的关键技术。MTS具有模式复杂、时间顺序、变量之间存在相关性等特性,如何利用这些特性提升MTS聚类效果具有重大理论和应用价值。受图嵌入技术在各领域的优异表现

学位

面向缺失数据的因果特征选择算法研究

因果特征选择旨在学习类变量的马尔可夫毛毯（Markov blanket,MB）。类变量的MB意味着类变量和它的MB之间存在潜在的因果关系,以类变量的MB为条件,所有其它特征在概率上独立于该类变量,这使得因果特征选择能够识别潜在的因果特征用于特征选择,以构建健壮、可解释的预测模型,并且在理论上,类别变量的MB已经被证明是特征选择的最优特征子集。当前的因果特征选择算法主要处理没有缺失值的数据,然而缺失

学位

隧道车辆定位系统关键技术的研究设计与实现

隧道内行驶车辆的实时位置,无论对行驶的车辆自身还是对隧道车流量分析、隧道交通事故分析以及预警等都有重要的使用价值。但因为隧道环境容易遮挡GPS信号,故无法在隧道内获取到车辆的实时位置。解决这一问题的关键在于研制一套专用的隧道车辆定位系统。整个系统运行机制是,通过车载的Tag定位标签与隧道两旁部署的Anchor基站进行数据通信,进而通过相关的定位求解算法将数据汇总运算,最终求得车载Tag的实时位置信

学位

基于视觉-文本语义对齐的视觉问答模型研究

视觉问答任务要求深入理解视觉和文本内容,从而获取关键信息以更好地回答问题。许多研究已经证实,改进多模态特征提取、对齐和融合以获得更准确和更丰富的全局特征,成为视觉问答任务的重要研究方向。该方向的核心是如何将提取到的图像特征及问题特征正确的对齐,从而提高视觉-文本语义对齐性。为了提升多模态特征的对齐性,本文对视觉问答的视觉-文本语义对齐算法展开研究。本文的主要工作如下:（1）目前大多数基于注意力机制

学位

基于标签特定特征的多标签分类方法研究

多标签分类旨在求解每个实例同时与多个类标签相关联的问题。然而,已有多标签分类方法大多利用统一特征表示的实例进行分类任务。由于每个标签都具有其自身特点,应为每个标签找寻其最相关、最有辨别力的特征即标签特定特征,用于该标签的分类。此外,实际应用中的训练数据常存在特征缺失的情况。因此,如何在特征缺失的环境下为每个标签抽取标签特定特征成为多标签分类方法研究的重要任务之一。为此,本文主要针对标签特定特征与特

学位

区块链智能合约脆弱性的识别和定位问题研究

区块链技术独有的去中心化、公开透明、集体维护、不可伪造、不可篡改等特性为构建价值互联平台提供了可能,区块链技术的研究与应用也逐渐被很多学者和科研人员重视,并呈现出爆发式增长态势,其中智能合约的产生是区块链历史上的一个里程碑式的事件。智能合约是部署在区块链网络上的代码,并以透明和去中心化的方式自动执行事务,一旦部署,智能合约不可更改,在合同执行过程中几乎没有任何补救措施可以用来处理代码错误。为了提高

学位

基于卷积神经网络的遥感图像分类算法研究

遥感图像分类旨在为遥感图像贴上基于其内容的语义类别标签,其是遥感图像解译的重要手段,遥感图像在地质灾害监测与预警、土地利用及城市规划等方面具有重要的应用前景。随着遥感成像技术的进步,遥感图像的空间分辨率越来越高,所覆盖的类别也越来越多,且类别之间互相影响,因此准确地对遥感图像分类难度加大且导致分类性能下降,如何选择更加可靠有效的分类算法提升分类性能是当前热门研究问题。近几年来相对于传统的遥感图像分

学位

基于深度学习的视网膜眼底图像分割方法研究

视网膜血管,特别是微小血管的形态学变化在年龄相关性黄斑变性、糖尿病性视网膜病变和视网膜静脉阻塞等严重威胁人类视力的疾病早期诊断和临床预后中起着至关重要的作用。青光眼是一种常见的,致盲率高的眼科疾病,且造成的视力损伤通常不可逆,及早诊断和预防非常重要。杯盘比是用于早期诊断青光眼的的重要生物标志物之一。从眼底图像中准确分割出血管及视杯视盘,是对眼底视网膜结构进行监测、形态学分析,进而辅助诊断的关键步骤

学位

基于Faster R-CNN的多源行人检测研究

基于深度卷积神经网络的可见光行人检测研究已经取得显著成果,并且给各行各业带来革命性的转变,其中无人驾驶、视频监控是其重要的使用场景之一。但可见光行人检测不能满足全天应用的要求,而利用可见光与红外两个模态图像的互补性,可以弥补可见光行人检测难以应对光照变化、恶劣天气的缺陷。基于深度卷积神经网络的多源行人检测性能受制于小尺寸行人目标的识别技术以及两模态融合技术,且可见光与红外图像在融合特征中占比应适应

学位

存在互耦下的双极化共形阵列DOA估计

共形阵列具有良好的空气动力学特性,能够有效的节省空间,还具有减少雷达散射截面（Radar Cross Section,RCS）等优点,被广泛应用于飞机、导弹、无人机等领域。波达方向（Direction of Arrival,DOA）估计是共形阵列研究的关键技术之一,在军事对抗、信息反侦探中发挥着极其重要的作用。而研究复杂环境下的共形阵列DOA高分辨率估计是当今共形阵列研究的前沿课题。本文主要研究存

学位

基于图卷积网络和注意力机制的行人再识别研究

与本文相关的学术论文