论文部分内容阅读
行人再辨识可应用于刑探侦查、社会安保等领域。已有许多行人再辨识方法被提出,主要分为两大类:基于人工设计特征的行人再辨识方法和基于深度学习的行人再辨识方法。早期行人再辨识一般采用基于人工设计特征的方法,其算法理论性强且计算量小,但由于此类特征需由人工设计,因此成本较高且易忽略行人特征。近年来深度学习方法的快速发展,为行人再辨识的应用提供了新的契机。将深度学习与行人再辨识结合,在免去大量人工成本的同时,可以使机器自动地去学习和优化行人特征,从而提高行人再辨识算法的性能。但由于行人照片的分辨率较低,且进行深度学习时,特征图尺寸不断变小的过程中会损失大量可用信息。鉴于人工设计特征与深度学习在行人再辨识已经取得的瞩目成绩,本文融合上述两个研究方向,提出了可用于行人再辨识的区域稀疏注意力网络,该网络通过采用随机区域批量遮挡的数据增强方法,以及嵌入了稀疏注意力机制这两种算法,可以有效避免卷积过程中必要的信息损失,主要方法如下:1)嵌入稀疏注意力的压缩激活网络。该网络是由压缩激活网络改进而来。首先将压缩激活网络中的压缩激活模块提取出来,对其进行归一化处理,由此生成注意力模块:归一化的压缩激活模块;然后将4个归一化的压缩激活模块分别应用到残差网络的5个卷积层之间;最后在5个卷积层之间再加入4条短连接,构建成嵌入稀疏注意力的压缩激活网络。实验表明,相对于压缩激活网络,本文提出的方法在行人再辨识数据集Market-1501上的Rank-1和mAP分别提高了4.2%和4.4%。2)采用随机区域批量遮挡的数据增强方法。该方法首先将一个训练批次的行人照片水平均匀分割为6个区域;然后将6个区域中的2个区域随机遮挡住,使得神经网络只需处理剩余的4个区域;最后对这4个区域进行全局最大池化处理后并进行分类。实验表明,相对于压缩激活网络,本文提出的方法在Market-1501上的rank-1和mAP分别提高了5.1%和7.8%。在多个行人再辨识数据集上的测试结果表明,嵌入稀疏注意力的压缩激活网络具有良好的特征提取能力,而批量地对行人图片进行随机区域遮挡也使得网络具备了关注微小特征的能力。这两种方法的结合在解决目标行人较小、行人背景复杂和不同行人相似的问题时,取得了较好的效果。