论文部分内容阅读
随着国家推进“平安城市”“天网工程”“雪亮工程”来建设多级视频监控并联网应用,监控视频的数量与日俱增,在安保方面单靠人力资源在海量的视频里进行行人追踪和监控将会非常的困难。而行人重识别是解决这一问题的关键技术,它是计算机视觉领域一个非常重要的且具有挑战性的课题,因为实际应用场景下环境复杂,摄像头视角和光照等条件变化大且容易存在多个行人之间的遮挡现象。因此,如何提取出全面且辨别性强的行人特征是当前研究行人重识别任务需要重点关注的问题。随着卷积神经网络的发展,使用卷积神经网络模型对行人特征进行提取可以有效的提高行人重识别的准确率。本文基于卷积神经网络对行人重识别模型及算法进行研究,主要研究工作如下:(1)针对当前数据集中图像的不对齐导致难以获得较全面的行人描述符问题。本文结合细粒度识别框架,提出了基于双线性CNN和分块特征的行人重识别模型。该模型使用精简的残差网络组成双线性框架,并使用分支网络对特征进行水平分块后继续对分块进行更加细粒度特征的提取,使得融合后的行人既包含全身特征,又包含分块的细粒度特征,这两部分特征组成同时包含全身和其他分块信息的行人描述符,从而提升模型的准确率。训练时使用标签平滑后的交叉熵损失和难分负样本的三元组损失对网络模型进行优化,缩小同一类行人之间的距离,同时扩大不同类行人之间的距离。在数据集Market-1501和CUHK03数据集上对本算法进行有效性验证,结果表明本文所提出算法在性能上优于传统算法和其他同类型的行人重识别算法。(2)针对全局-局部描述符对齐网络在特征提取和不同分块加权方面的不足,本文提出了一种基于注意力机制和自适应加权的行人重识别模型。该方法使用人体关键点检测网络对行人区域进行提取,将行人分为头部、上半身和下半身,然后使用嵌入注意力机制的特征提取网络,对全身和三个部分进行特征的提取,注意力机制可以通过对有用的通道特征进行加权来选择特征,提高网络提取特征的辨别能力。设计一种自适应加权模块对行人的三个部分进行更加合理的加权,进一步提高模型的性能。在数据集DukeMTMC-reID和Market-1501上进行算法的性能对比和有效性验证。实验结果表明,嵌入注意力后的网络可以提取到辨别度更高的特征,自适应加权模块也能提升进一步提升识别性能。