结合注意力机制的无监督跨域行人重识别研究

来源 :西安工业大学 | 被引量 : 0次 | 上传用户：YINGWU2008

【摘要】

：

【作者】

：

吴玺

【机构】

：

西安工业大学

【出处】

：

西安工业大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

行人重识别技术被广泛用于智能安防以及搜寻走失儿童等社会安全问题。有监督行人重识别和无监督行人重识别作为行人重识别的两个方向。在实际应用中,有监督行人重识别虽然取得了很好的结果,但是需要耗费大量的成本去标注数据。因此当行人在不同域的场景出现时,基于无监督学习的行人重识别应用更加广泛。与有监督方法相比,无监督行人重识别通过使用带标签的源域数据和不带标签的目标域数据进行训练,且这两个数据集通常采集的图像信息不同。在源域数据集上训练的模型,直接应用于目标域数据集时,受环境因素的影响,并且缺乏扩展能力,模型有明显地性能下降。本文通过对无监督跨域行人重识别方法展开研究,主要研究工作如下:（1）针对特征辨别性不足和聚类产生伪标签噪声的问题,本文提出一种基于精化聚类和注意力块的无监督跨域行人重识别方法。首先,在提取行人特征时,将位置注意力块和三重注意力块进行结合,并添加至骨干网络Res Net-50中进行特征聚合,以减少由于全局池化造成的位置信息丢失,捕获交叉维度,来计算注意权重,挖掘细粒度信息。其次,对DBSCAN聚类进行改进,设计可靠性度量准则判定聚类实例可靠性,实现由粗到精的聚类过程。最后,将聚类中心动态存储到记忆模块,动态构建类中心,进行不变性学习。实验结果表明,文中设计的新方法和其他典型方法相比,在目标域为Market-1501数据集上m AP的准确率分别提高2.4%,在目标域为Duke MTMC-Re ID数据集上m AP的准确率分别提高6.5%。（2）对于忽略局部特征和域间隙引起的特征变化两个问题,提出一种结合元学习的无监督自适应域行人重识别方法。首先,对来自不同域的不变特征和特定特征进行建模,充分考虑不同域特征的多样性和互补性,来缓解域间隙问题。其次,在每个训练周期内对全局特征和两个局部特征进行独立聚类,使用每个分支的精化伪标签来微调整个网络。最后,元学习优化模块帮助模型学习相机不变的表示,使用所提出的元学习策略对模型进行优化,鼓励模型学习相机不变的特征。实验结果表明,文中设计的新方法和其他典型方法相比,在目标域为Market-1501数据集上和m AP的准确率分别提高2.0%,在目标域为Duke MTMC-Re ID数据集上m AP的准确率分别提高2.5%。

其他文献

面向口腔虚拟手术的力反馈模型研究

随着虚拟现实技术的快速发展,虚拟手术作为虚拟现实技术在医学领域的典型应用,已从传统的视觉交互向触觉交互发展,因此力反馈模型的研究成为虚拟手术的关键技术,一个良好的力反馈模型和力反馈算法可以为虚拟手术带来更强的沉浸感。本文以虚拟现实技术在口腔医疗教育培训中的应用作为背景展开,研究了力反馈的两个阶段,即几何建模阶段和力反馈建模阶段,在现有力反馈模型基础上提出了改进方案,解决了反馈力输出不连续且不稳定的

学位

不同环境规制工具对我国物流业碳排放效率影响研究

为保障生态文明建设,实现可持续发展,中国在2020年提出了双碳战略目标。作为近年来快速发展的综合性服务业,物流业的碳排放量一直在我国占据较大比重,为响应国家的双碳目标,急需由高碳排放发展模式向低碳发展模式转型,而环境规制是实现低碳物流转型的重要手段。目前关于环境规制的研究主要从单一环境规制工具的角度出发,较少考虑不同环境规制工具的交互作用;同时现有研究还发现环境规制对我国碳排放效率存在非线性的门槛

学位

头部运动变化中的视线方向估计方法研究

视线估计技术是利用现有的不同检测方法获取用户当前注视方向的技术。视线估计在生活中发挥着越来越重要的作用。在注视的过程中,伴随着头部的运动行为,如何提高头部运动变化时中的视线估计精确度,是目前视线估计领域的一个挑战。本文提出使用眼动特征并结合头部运动变化特征的视线估计模型。论文主要研究了如下内容:1)眼动特征提取本文眼动特征主要包括瞳孔中心、眼角点以及二者构成的眼动向量。首先应用Haar特征和Ada

学位

面向光学遥感图像的目标检测方法研究

当前光学遥感图像目标检测技术在军事、环境、城市规划、农业、林业等领域有着广泛的应用。与自然图像相比,遥感图像具有小目标多且密集分布、方向多样、背景复杂和目标尺度变化范围广泛等特点,这为通用目标检测算法在遥感图像上的应用带来了一定的挑战。对此也有很多针对性的改进算法被提出来,但是大多都只从遥感图像中的某一两个难点问题出发,而缺乏一定的综合性,其检测性能也很难达到在普通图像上的较高水平。为了能够更加快

学位

基于深度学习的压缩感知图像重构算法研究

随着大数据信息化时代的到来,各个领域数据信息急剧增长,人们对数据信息处理技术的要求也越来越高。压缩感知突破奈奎斯特采样定律,很大程度上缓解了数据的获取和传输压力。传统的压缩感知重构算法需要进行多次迭代求解原始信号,使得算法计算速度慢,重构精度差,且不具有实时性等优势。近年来,随着深度学习的快速发展,深度神经网络技术在压缩感知领域的应用有效地提高了压缩感知重构的精度和效率,并引起学者们的广泛关注和研

学位

基于PGNet的新闻摘要生成研究

如今的互联网时代,大量的新闻出现在人们的日常生活中,需要人们花费更多精力和足够时间在庞大的信息库中去搜索和甄别我们感兴趣的内容,而文本自动摘要技术可以在不更改文章含义和不丢失其重要信息的前提下,概括出新闻的关键信息和主体内容,从而帮助人们减少阅读的时间。近年来指针生成网络模型（Point Generator Network,PGNet）的提出极大地促进了摘要生成技术的发展,有效解决了未登陆词无法生

学位

基于图模型的软件安全漏洞检测技术研究

随着软件规模的不断增加和复杂性的提高,软件中存在的安全隐患也越来越多,这使得软件容易受到不法分子的攻击。为了有效提高软件的安全性,漏洞检测技术成为了软件安全领域的研究重点。由于图模型具有较强的表征能力,基于图模型的漏洞检测研究应运而生。然而,现存的图模型在源代码的表征过程中,存在图模型较为单一而导致的源代码表征信息缺失,使漏洞检测的误报率增加的问题。同时由于源代码结构复杂,导致对应图结构信息冗杂,

学位

基于图神经网络的漏洞检测技术研究

随着生产力水平的发展,人们对于软件功能的需求不断增加,导致软件的体系结构也随之变得复杂,无形之中提高了软件中可能存在安全缺陷的概率。此外,代码复用也会给漏洞的传播提供可乘之机。一旦这些安全漏洞被不法分子所利用,所造成的损失不可估量。因此,如何保证软件安全成为人们亟待解决的问题。随着深度学习技术在图像领域以及自然语言处理领域获得了巨大的成功,大量的信息安全研究人员也开始使用深度学习的方法来进行漏洞检

学位

BL控股股东股权质押对公司价值的影响研究

股权质押作为一种融资方式,具有成本低、限制条件少、操作简单等优势,受到了部分上市公司的青睐。股权质押虽具有诸多优点,但是也存在着潜在的风险。当控股股东进行高比例的股权质押活动时,会加大现金流权和控制权的分离程度,引发代理问题,将会损害债权人和中小股东的利益。同时,在高比例的股权质押下控股股东还会为了维持自身利益的最大化而去损害公司价值。因此,研究控股股东股权质押对公司价值影响的路径和程度,对于加强

学位

自动驾驶复杂场景下目标检测研究

近年来,汽车数量增加导致的交通问题层出不穷,由此引发的自动驾驶研究已被国内外众多企业提上日程。随着深度学习的发展,一般简易交通场景下的目标检测精度已可达驾驶标准,但面对复杂场景下的目标检测,道路中存在遮挡目标和小目标检测,通过传统算法无法获取更高精度的检测。因此,本文采用了深度学习为基础的目标检测技术,分析自动驾驶复杂场景下目标检测的重难点,进而研究适用于复杂场景下的目标检测算法。具体的研究工作如

学位

结合注意力机制的无监督跨域行人重识别研究

与本文相关的学术论文