论文部分内容阅读
为了及时有效的解决社会安全问题,在一些大型的公共场所均已经配套完善的视频监控系统,记录密集人群的行为信息或者运动轨迹,对维护社会秩序和社会公共安全具有重要作用。行人重识别问题就是要对不同摄像头的图像数据或者视频数据检测出的行人进行判断是否是同一个行人号码标识(Identity Document,ID)。行人重识别技术不但已经成为执法部门管理公共安全和犯罪侦破的重要手段,而且也可以计算公共场所的人流数据,以此改进交通系统设计或者优化商场商品布局。身份嵌入(Identification Embedding,IDE)网络作为行人重识别非常重要的基准之一,它通过特征描述的方法,把每个行人当做分类问题的一个类别,但是在实际应用中,IDE网络存在提取特征无法适应复杂环境变化和全局特征泛化能力弱的问题,因此针对IDE网络存在的不足从三个方面进行改进。在主干网络方面,分别使用DenseNet和PCB网络代替ResNet对输入图片提取特征;在数据增强方面,为了使模型适应复杂环境的变化,采用色彩抖动和随机擦除对数据集进行扩充;在网络结构方面,分别引入空间注意力和通道注意力两种不同的注意力机制将其和IDE网络进行融合。经过实验分析,得出以下结论:(1)改进主干网络的DenseNet在提取特征方面优于原始主干网络ResNet,且可以防止模型过拟合;改进主干网络的PCB网络对特征图进行水平分割,可以使模型学习到每个行人不同区域的局部特征。DenseNet改进的IDE网络和PCB网络改进的IDE网络的首位命中率分别比原始IDE网络高1.66%和3.18%;(2)色彩抖动可以让模型适应不同光照条件的复杂背景,随机擦除则可以克服行人的部分遮挡问题,增强模型的泛化能力。融入色彩抖动的改进IDE网络和融入随机擦除的改进IDE网络的首位命中率分别比原始IDE网络高1.57%和2.40%;(3)空间注意力机制和通道注意力机制通过对特征进行空间转换和重标定的策略,可以得到更加鲁棒的特征。融合空间注意力的改进IDE网络和融合通道注意力的改进IDE网络的首位命中率分别比原始IDE网络高2.20%和1.10%。