基于注意力模型的行人重识别算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:mbc3204
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别是视频监控领域中的一项重要研究任务。作为一个实例级的识别问题,行人重识别依赖于识别特征。近年来,注意力模型越来越多地应用到了计算机视觉的各个领域中,注意力模型能着重学习输入信号中信息最丰富的部分,能有效地改善网络对于行人特征的学习能力,使得特征提取网络关注行人图像中更具有判别性的特征。现有的算法往往都只使用单一的注意力,忽略了不同注意力网络的互补作用,本文以注意力模型为核心分别对基于图像的行人重识别和基于视频的行人重识别展开了研究,提出了两种新型的基于多注意力模型的网络。
  首先,针对基于图像的行人重识别,本文设计了一种多注意力联合学习网络。此网络以ResNet50作为主干网络,在主干网络中嵌入Soft注意力模块和高阶注意力模块,同时增加了两种尺度的局部特征提取网络,组合成了多注意力联合学习网络,获得了更具判别力的行人特征表示。利用Market1501和DukeMTMC-ReID数据集对多注意力联合学习网络进行实验评估,实验结果表明了本文提出的多注意力联合学习网络比原始ResNet50网络两个数据集上Rank-1和mAP指标上都得到了较大提升,并且优于目前绝大多数主流算法。
  另外,针对基于视频的行人重识别,本文设计了一种融合多注意力异构网络。此网络以OSNet作为主干网络,在主干网络中嵌入了Soft注意力模块和非局部注意力模块,同时增加了特定的局部特征提取网络,增强了网络对于视频序列的时空信息和局部特征的学习能力。利用Mars和DukeMTMC-VideoReID数据集对融合多注意力异构网络进行实验评估,实验结果表明了本文提出的融合多注意力的异构网络比原始OSNet网络在两个数据集上Rank-1和mAP指标上都得到了一定提升,并且在当前先进算法中具有一定的竞争力。
其他文献
学位
学位
学位
学位
学位
学位
学位
学位
目前,高亮度电子源中所用光电阴极多采用具备低功函数的碱金属(包括多碱合金)或具备负电子亲和势的Ⅲ-Ⅴ族化合物半导体材料,其具有较高的电子发射能力.相对于上述传统光电阴极及其较为单一的表面结构,新兴的纳米结构与材料有望实现对入射光的可控调制,进而实现对光电子发射的操控.表面等离激元光子学主要研究亚波长金属纳米结构独特的光学性质及其电子的动力学特性,以及光与物质的相互作用过程.表面等离激元的激发会伴随
论文的主要工作包括以下几个方面:介绍了适应高动态环境特点的几项关键技术的原理:串并组合的信号快捕技术、非相干伪码延迟锁相环技术、叉积自动频率跟踪环技术和载波辅助校正伪码延时技术.在此基础上,提出了一种全数字化的高动态GPSC/A码接收机设计方案,并对其中重要的结构和参数的设计方法进行了说明.对载波频率跟踪和载波相位跟踪的性能进行了分析和比较,得出了频率跟踪与相位跟踪的噪声性能与动态性能互补的结论.