基于注意力机制和特征融合的行人重识别方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:Leichenglin8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,行人重识别方法对构建智能城市发挥了巨大作用。行人重识别是指通过从多个不重叠的摄像头拍摄到场景下再次检索到指定行人的方法。由于行人重识别方法应用在复杂的无约束场景下,面临了背景干扰、光线变化、遮挡等问题。其中,本文针对背景干扰的问题,采用了注意力机制模块用于增强行人前景部分特征,抑制背景信息的影响,同时结合特征张量分割方法对注意力增强后的特征进行分割来引入指定区域局部特征信息,最终提高模型性能。本文的主要研究内容如下:(1)提出一种基于双重注意力金字塔特征融合的行人重识别方法。采用双重注意力和金字塔特征融合的方法提取信息。金字塔特征融合利用特征张量分割定位行人局部区域并融合来枚举更多特征,而双重注意力能增强水平特征条内行人前景部分,抑制背景信息的干扰。此外,本方法采用Ge M池化提取分支特征,Ge M是一种泛化形式的池化,既保留最大池化能提取到更多纹理细节的优势,又保留平均池化能关注更多全局上下文信息的优点,同时基于度量损失和分类损失联合训练网络效果相比使用单种损失进行训练效果要更好,但是不同损失间会出现相互干扰的问题,本文借鉴BOT模型通过引入BN层来解决不同损失相互干扰的问题。最后通过在Duke MTMC-re ID、Market1501和CUHK03数据集上进行大量实验验证结果,本方法在Market1501和Duke MTMC-re ID上Rank-1精确度分别达到96.0%和89.9%。在CUHK03的Label和Detected上Rank-1分别达到78.0%和75.2%。(2)提出了一种基于关系感知全局注意力特征融合行人重识别方法。该方法采用OSNet网络作为主干网络,OSNet网络具有计算开销小并且能提取到全尺度特征的能力,同时由于双重注意力对整个行人的注意力关注范围有限,这里引入注意力关注范围更大的关系感知全局注意力对行人整体前景特征增强,减少背景信息的干扰。最后通过在三个数据集上的大量实验验证,在Market1501和Duke MTMCre ID上平均精度值(m AP)分别达到89.1%,和80.6%在CUHK03的Label和Detected上m AP分别达到73.8%和70.3%。
其他文献
代码克隆检测是软件工程领域的重要研究课题,有效发现软件系统中、软件系统之间的代码克隆现象对于软件开发以及解决软件侵权纠纷都具有现实意义。当前存在如下问题:一方面,实际工程应用中源代码不易获取,现有基于源代码的检测方法无法使用;另一方面,已有基于字节码的检测方法检测效果仍有提升空间。为了在缺失源代码情况下进行代码克隆检测并同时确保检测效果,本文提出一种基于字节码和孪生神经网络的代码克隆检测方法:SJ
学位
太原地铁正处于“建设、运营”的双重时期,健全隐患排查机制,防患于未然,保证其全过程的安全成为重中之重。因此,综合“人、机、环、管”四要素的太原地铁全域安全体系应运而生。基于安全管理的专业知识,本论文建立了太原地铁“五位一体”安全管理体系,能够及早实现隐患辨识,隐患分级与应急管理,构建了太原地铁信息管理平台,形成动态数据库,实现隐患数据自学习、自分析、自响应,让隐患无处遁形,切实保证地铁的运行安全。
期刊
虚拟电厂对电力系统的分布式新能源进行聚合和管控,提高了电网运行的灵活性和可靠性。而虚拟电厂的高效运行依赖于大量数据的高速高精细度处理分析能力,为满足当前电网的运行调度需要,文章提出了基于云边协同的虚拟电厂调度系统设计方案。针对虚拟电厂特性及数据处理需求,构建了虚拟电厂云边协同调度系统总体架构,以边缘集群实现对虚拟电厂单元的分布式管理,云端对边缘集群进行管理和控制,协调整体分析计算任务的分配,并对系
期刊
建模教学就是把日常生活中的数量关系借助假设的方法,用专业的语言和数学知识将其内容充分地展现出来。也就是说,如何有效地解决数学问题,并将模型和现实相结合。一般来说,用数学建模方式处理数学问题,能够对各种数量关系进行精炼,将数学问题转化为实际问题,通过建立数学模型来处理具体问题,这样不仅可以提高学生应用数学知识的能力,还能使学生对数学有一个全面的认识。因此,教师应充分认识到建模教学在高中数学教学中的意
会议
交通流量的准确预测是智慧交通系统中关键的一环。对城市交通系统中具有时空特征的交通流量数据进行分析,从中提取隐含的特征,实现交通状况的实时调度、城市道路规划具有重要意义。随着道路设施的大规模部署,数据量也在不断增长、城市道路状况也变的越来越复杂,虽然国内外学者提出了很多关于交通流量预测的方法,但是仍然存在许多待解决的问题包括:时空特征提取困难、道路动态相关性特征提取不够完善、空间特征提取方法存在缺陷
学位
基于变分偏微分方程理论,将平滑结构张量与非局部思想相结合,构建了非局部平滑结构张量。同时,以非局部平滑结构张量为基础,提出了非局部平滑结构张量自适应的全变分图像复原模型和非局部平滑结构张量驱动的各项异性扩散图像复原模型,并整合相关算法设计了局部结构保持的单幅图像复原系统,其具体内容描述如下:构建了非局部平滑结构张量自适应的全变分图像复原模型。首先,将非局部思想应用于平滑结构张量的改进,构建了一种非
学位
混沌是确定性系统中的不确定现象,能够用来产生大量随机性优良的序列,因此被广泛地应用在各种信息安全领域。而随着大数据时代的到来,各行各业每天都会产生大量的隐私信息,而图像作为与文本不同的信息载体,具有冗余性高、相关性大、数据量多等特点,更是信息安全领域的研究重点。为了解决现有图像加密算法存在的加密效率低、安全性不够高等问题,本文从高维混沌和低维混沌入手,提出了两种基于混沌理论的图像加密算法。(1)提
学位
将大脑磁共振图像(Magnetic Resonance Imaging,MRI)分割为脑脊液(Cerebrospinal Fluid,CSF)、灰质(Gray Matter,GM)和白质(White Matter,WM),然后对脑组织进行定量分析是脑疾病诊断中至关重要的一步。由于医学图像公开数据集少,数据集图像质量参差不齐,图像的自动化分割是一个较大的挑战。近年来深度学习的算法在医学图像分割领域取
学位
文字效果图像广泛存在于互联网的各个角落,在诸如海报和广告设计等许多视觉创作任务中是广泛需要的。然而,在真实的项目中,针对一个字体设计完整的文字效果图像是一项费力耗时的任务,因此利用计算机自动生成文字效果图像的方法被迫切需要。随着深度学习相关技术的发展,图像风格迁移逐渐成为目前热门的研究方向。文字效果图像风格迁移旨在以参考图像的风格去渲染文字。对目前现有的文字效果图像风格迁移算法进行分析,针对当前算
学位
目前高动态范围(HDR)成像技术已普遍应用于各种商业影像行业以及个人手机设备中,其可以获得纹理清晰、颜色信息丰富的图像。使用多曝光图像融合(MEF)方法获得HDR图像是一种有效的手段,大多数多曝光图像融合方法只能在静态场景下取得令人满意的结果,忽视了大部分场景中存在物体运动,这就导致融合结果中存在重影伪影(GA)问题。目前大部分多曝光融合方法去除鬼影重影问题都以牺牲纹理细节为代价。因此本文针对动态
学位