论文部分内容阅读
伴随着大数据时代的到来以及图形计算能力的提高,计算机视觉下的模式识别等研究方向得到越来越多的重视和发展。基于人脸、指纹和静脉等生物特征的身份验证和识别技术在各种场合的需求越来越大,应用场景也越来越普遍,如今已经成为人们日常生活不可缺少的一部分。其中,步态识别是一种根据人的行走姿态来区分不同个体的生物特征识别技术。作为一种新兴的识别技术,步态识别具有在非受控、远距离、低分辨率的场景下进行身份识别的优点,并且步态不易改变和伪装,所以近年来得到的关注逐渐增多。但是在日常生活中,监控系统中捕获的步态样本与注册的步态样本往往存在视角差异,这会大大的削弱经典步态识别算法的有效性。所以,解决跨视角步态识别问题、提高步态识别的准确性和实时性,是步态识别产品必须要攻克的技术难题。目前跨角度步态识别的困难在于行人步态在不同视角下的视觉差别巨大。另外,由于步态特征仅包含行人的体型轮廓以及走路姿态信息,不包含颜色和纹理特征,这使得从不同视角的步态中,很难提取表征行人身份的视角不变性特征。为了解决步态识别在跨角度时识别率低的问题,本论文研究了基于深度度量学习的视角不变性步态特征提取和跨角度步态识别技术。具体而言,本文主要贡献总结如下:第一,提出了身份与视角特征分离的跨视角步态识别算法,将自编码器设计成两个编码器即视角编码器(View Encoder,VE)和身份编码器(Identity Encoder,IE)以及一个步态解码器(Gait Decoder,GD)的形式来进行身份信息和视角信息分解。具体而言,对于视角编码器的输出,设计了视角回归损失对其视角进行学习,以保证该输出特征包含视角信息;对于身份编码器的输出,为了保证不同身份之间的可判别性,采用三元组损失进行特征度量学习;为了使得视角编码器的输出不包含身份信息,以模糊身份的方式用一个身份分类器进行学习;另外,为了增加身份编码器输出特征的判别力度,保证此身份分类器的有效性,此身份分类器也将身份编码器输出的身份信息进行分类学习;为了保证身份编码器的输出和视角编码器的输出分布不相似,在损失函数中设计了去相似性损失项以最小化二者的相似性。在CASIA-B和OU-ISIR数据库上的实验结果表明,本方法可以很好地将步态样本中的视角信息和身份信息进行分离,并用含有身份信息的特征验证了本特征提取方法的有效性。第二,提出了分块时空表达融合框架(Block-wise Spatial-temporal Representation Aggregation,BSRA)来解决跨视角步态识别问题,此框架由一个分块水平金字塔(Block Horizontal Pyramid,BHP)模块和一个时空特征融合(Spatial-Temporal Feature Aggregation,STFA)模块构成。具体来说,因为行人身体轮廓的不同部位对步态识别的贡献是不同的,所以首先将人体分块后经过水平金字塔以便从多个尺度的步态轮廓中提取局部步态特征;然后,使用个时空特征融合模块汇总这些特征并生成最终表示,该最终表示包括用于在空间上汇总的块注意力拼接(Block Attention Splicing)模块和在时间上汇总的最大步态能量(Maximum Gait Energy)模块。为了保证所提取的时空特征具有视角不变性,提出的多视角损失函数可以进行多视角共同学习并充分利用所有视角的步态信息。此外,我们在欧几里得距离度量的基础上为正样本对增加了切比雪夫距离,可以在不影响特征判别能力的情况下加快模型的收敛速度;测试阶段,提出了步态重排序(Re-ranking)方法,将重排序引入到步态识别的后处理中以提高查询样本的匹配精度。此方法在CASIA-B、OU-ISIR数据库上进行了充分的实验,得到了与现有方法相比最好的识别效果。在背包、不同着装以及短序列下的实验说明了该方法在具有挑战性的环境中依然可靠。另外,此方法在多视角实验中也得到很好的识别结果,并得到了多视角识别率的变化趋势。