基于区域稀疏注意力网络的行人再辨识方法研究

来源 :广西师范大学 | 被引量 : 1次 | 上传用户:liuzhenguo_09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人再辨识可应用于刑探侦查、社会安保等领域。已有许多行人再辨识方法被提出,主要分为两大类:基于人工设计特征的行人再辨识方法和基于深度学习的行人再辨识方法。早期行人再辨识一般采用基于人工设计特征的方法,其算法理论性强且计算量小,但由于此类特征需由人工设计,因此成本较高且易忽略行人特征。近年来深度学习方法的快速发展,为行人再辨识的应用提供了新的契机。将深度学习与行人再辨识结合,在免去大量人工成本的同时,可以使机器自动地去学习和优化行人特征,从而提高行人再辨识算法的性能。但由于行人照片的分辨率较低,且进行深度学习时,特征图尺寸不断变小的过程中会损失大量可用信息。鉴于人工设计特征与深度学习在行人再辨识已经取得的瞩目成绩,本文融合上述两个研究方向,提出了可用于行人再辨识的区域稀疏注意力网络,该网络通过采用随机区域批量遮挡的数据增强方法,以及嵌入了稀疏注意力机制这两种算法,可以有效避免卷积过程中必要的信息损失,主要方法如下:1)嵌入稀疏注意力的压缩激活网络。该网络是由压缩激活网络改进而来。首先将压缩激活网络中的压缩激活模块提取出来,对其进行归一化处理,由此生成注意力模块:归一化的压缩激活模块;然后将4个归一化的压缩激活模块分别应用到残差网络的5个卷积层之间;最后在5个卷积层之间再加入4条短连接,构建成嵌入稀疏注意力的压缩激活网络。实验表明,相对于压缩激活网络,本文提出的方法在行人再辨识数据集Market-1501上的Rank-1和mAP分别提高了4.2%和4.4%。2)采用随机区域批量遮挡的数据增强方法。该方法首先将一个训练批次的行人照片水平均匀分割为6个区域;然后将6个区域中的2个区域随机遮挡住,使得神经网络只需处理剩余的4个区域;最后对这4个区域进行全局最大池化处理后并进行分类。实验表明,相对于压缩激活网络,本文提出的方法在Market-1501上的rank-1和mAP分别提高了5.1%和7.8%。在多个行人再辨识数据集上的测试结果表明,嵌入稀疏注意力的压缩激活网络具有良好的特征提取能力,而批量地对行人图片进行随机区域遮挡也使得网络具备了关注微小特征的能力。这两种方法的结合在解决目标行人较小、行人背景复杂和不同行人相似的问题时,取得了较好的效果。
其他文献
大规模多输入多输出(MIMO)技术作为第五代移动通信的关键技术之一,已被证明能在不增加带宽的情况下提升系统的容量和可靠性。预编码技术可以有效抑制用户间干扰、码间干扰、
从单个多图中挖掘频繁模式现已经成为研究热点,如社交网络中,两个人之间可能有诸如Facebook、Twitter和LinkedIn等多个关系,挖掘社交网络多图中的频繁子图对发现社会互动机制
极化码于2009年由Arian教授所提出。凭借基于信道极化现象的特殊编码方式,极化码成为了一种被理论证明可达香浓极限的信道编码方案,吸引了信道编码领域专家的关注。在专家们
在无线网络中,将一个共同的信息同时传递给多个用户,多播技术在其中扮演了一个十分重要的角色。多播波束成形技术能够通过利用基站(BS)端的信道状态信息(CSI)进一步提升系统
乳腺癌是当今女性多发的癌症疾病之一,且发病率逐年上升。尽早发现乳腺癌并配以合理的治疗手段对于提升病发人群存活率具有重要意义。由于高敏感度与特异性,磁共振成像(Magne
教育是民族振兴、社会进步的基石。近些年来,面对稳定增加的生源,高等院校不断加强自身改革,坚持内涵发展,提高自身教学质量和教育水平,由过去粗放式的发展转变为提升教学质
频谱感知作为认知无线电关键技术和研究内容之一,对于缓解静态频谱分配策略与动态频谱需求之间的矛盾具有重要的研究意义。本文针对传统频谱感知性能不足和进一步提高频谱利
为了简化腹腔微创手术的导航系统,产生了基于SLAM的腹腔镜导航系统。将医学图像信息与实时腹腔镜视频融合在一起,可以极大的增加外科医生的视野,使医生能看到位于表面一下的
目前智能移动机器人是很多学者研究的主要方向,而同步定位与地图构建技术是移动机器人能够实现自主移动的关键。视觉SLAM系统是指搭载相机为传感器主体,能够同时进行定位与地
传统的手势识别方法依靠人工设计复杂的特征提取算法进行图像的特征提取,该方法对手势图像的采集设备、背景及人的手势动作要求较高。基于卷积神经网络的图像特征提取可以直