基于深度学习的跨视角步态识别算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:tangweichao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着大数据时代的到来以及图形计算能力的提高,计算机视觉下的模式识别等研究方向得到越来越多的重视和发展。基于人脸、指纹和静脉等生物特征的身份验证和识别技术在各种场合的需求越来越大,应用场景也越来越普遍,如今已经成为人们日常生活不可缺少的一部分。其中,步态识别是一种根据人的行走姿态来区分不同个体的生物特征识别技术。作为一种新兴的识别技术,步态识别具有在非受控、远距离、低分辨率的场景下进行身份识别的优点,并且步态不易改变和伪装,所以近年来得到的关注逐渐增多。但是在日常生活中,监控系统中捕获的步态样本与注册的步态样本往往存在视角差异,这会大大的削弱经典步态识别算法的有效性。所以,解决跨视角步态识别问题、提高步态识别的准确性和实时性,是步态识别产品必须要攻克的技术难题。目前跨角度步态识别的困难在于行人步态在不同视角下的视觉差别巨大。另外,由于步态特征仅包含行人的体型轮廓以及走路姿态信息,不包含颜色和纹理特征,这使得从不同视角的步态中,很难提取表征行人身份的视角不变性特征。为了解决步态识别在跨角度时识别率低的问题,本论文研究了基于深度度量学习的视角不变性步态特征提取和跨角度步态识别技术。具体而言,本文主要贡献总结如下:第一,提出了身份与视角特征分离的跨视角步态识别算法,将自编码器设计成两个编码器即视角编码器(View Encoder,VE)和身份编码器(Identity Encoder,IE)以及一个步态解码器(Gait Decoder,GD)的形式来进行身份信息和视角信息分解。具体而言,对于视角编码器的输出,设计了视角回归损失对其视角进行学习,以保证该输出特征包含视角信息;对于身份编码器的输出,为了保证不同身份之间的可判别性,采用三元组损失进行特征度量学习;为了使得视角编码器的输出不包含身份信息,以模糊身份的方式用一个身份分类器进行学习;另外,为了增加身份编码器输出特征的判别力度,保证此身份分类器的有效性,此身份分类器也将身份编码器输出的身份信息进行分类学习;为了保证身份编码器的输出和视角编码器的输出分布不相似,在损失函数中设计了去相似性损失项以最小化二者的相似性。在CASIA-B和OU-ISIR数据库上的实验结果表明,本方法可以很好地将步态样本中的视角信息和身份信息进行分离,并用含有身份信息的特征验证了本特征提取方法的有效性。第二,提出了分块时空表达融合框架(Block-wise Spatial-temporal Representation Aggregation,BSRA)来解决跨视角步态识别问题,此框架由一个分块水平金字塔(Block Horizontal Pyramid,BHP)模块和一个时空特征融合(Spatial-Temporal Feature Aggregation,STFA)模块构成。具体来说,因为行人身体轮廓的不同部位对步态识别的贡献是不同的,所以首先将人体分块后经过水平金字塔以便从多个尺度的步态轮廓中提取局部步态特征;然后,使用个时空特征融合模块汇总这些特征并生成最终表示,该最终表示包括用于在空间上汇总的块注意力拼接(Block Attention Splicing)模块和在时间上汇总的最大步态能量(Maximum Gait Energy)模块。为了保证所提取的时空特征具有视角不变性,提出的多视角损失函数可以进行多视角共同学习并充分利用所有视角的步态信息。此外,我们在欧几里得距离度量的基础上为正样本对增加了切比雪夫距离,可以在不影响特征判别能力的情况下加快模型的收敛速度;测试阶段,提出了步态重排序(Re-ranking)方法,将重排序引入到步态识别的后处理中以提高查询样本的匹配精度。此方法在CASIA-B、OU-ISIR数据库上进行了充分的实验,得到了与现有方法相比最好的识别效果。在背包、不同着装以及短序列下的实验说明了该方法在具有挑战性的环境中依然可靠。另外,此方法在多视角实验中也得到很好的识别结果,并得到了多视角识别率的变化趋势。
其他文献
随着现代工业的快速发展,大量性能更为优良的薄壁叶片类零件被应用在各种工业领域中。此类零件表面质量的好坏往往会对其工作性能及寿命产生较大影响,其中中小型薄壁叶片类零
目的:探讨脂质蓄积指数(LAP)与代谢综合征、糖尿病、心脑血管疾病发病的关系。方法:本研究基线调查以2009-2012年,浙江省代谢综合征调查数据为基线资料,内容包括流行病学问卷调查、体格检查和常见生化检查。研究对象为22649名18岁及以上常住居民。第一部分利用浙江省慢性病监测信息管理系统和记录连结方法,获取各个研究对象从基线调查到2018年期间糖尿病、心脑血管疾病发病信息,排除基线资料生化资料
目的对比边支斑块主动转移(Active Transfer of Plaque,ATP)技术与拘禁球囊技术(Jailed balloon technique,JBT)在治疗冠状动脉非左主干分叉病变中的临床应用疗效。方法将2017年3月-2018年3月在内蒙古自治区人民医院心血管内科接受治疗,进行冠状动脉造影术,术后确诊为冠状动脉非左主干分叉病变,且边支血管直径<2.5mm同意行经皮冠状动脉介入
目的:FGF21是一种参与代谢调节的细胞因子。DsbA-L是一种与脂联素多聚体形成有关的重要调节蛋白,两者在增加胰岛素的敏感性和增加能量代谢方面具有很多有益的作用。最近研究
随着工业化的进步,能源成为社会发展不可或缺的一部分,然而石油等不可再生资源越来越少且环境污染大,因此可再生新能源的研究工作成为现代发展的重点之一。丁醇具有辛烷值高
边缘检测在图像处理中占据着不容忽视的重要位置,在生产、生活中的诸多方面应用广泛,例如机械部件的故障检测、医学影像分析及模式识别等。但图像在获取以及存储的过程中非常
氮化铝(AlN)是一种重要的Ⅲ-Ⅴ族化合物半导体薄膜材料,广泛应用于制备高亮度LED、紫外探测器和高频大功率器件。金属有机气相化学沉积(MOCVD)是生长AlN最常用的方法。在AlN的MOC
多示例学习是一种新的学习框架,在机器学习领域引起了越来越多的关注。在多示例学习中,训练集由一组多示例包组成,而一个多示例包含有若干个示例。如果多示例包中至少存在一
近年来,煤炭资源仍然是我国能源消费的主体。煤炭行业不仅为各个行业提供了快速高效发展的可能,也对我国社会发展与经济建设起到了支撑作用。长期以来,粉尘都是煤炭生产过程中难以避免的问题。煤炭生产过程中会产生大量的粉尘,严重危害着井下工作人员的人身安全与生产器械的使用寿命。进行基于激光多普勒干涉技术的复合因素尘雾耦合试验研究,对治理综合机械化采掘工作面粉尘危害,保护井下作业人员的身体健康具有至关重要的作用
彩印钢板系统是一个复杂的控制系统。在印刷生产中,要求整个张力控制系统具有极高的控制精度,能够抵抗外界的干扰,减少系统的张力的波动,系统内由于各个参量存在着耦合和非线性,参量也随着系统运行随时的变化,这就对系统的稳定性带来的巨大的不确定因素,而传统的PID控制难于达到高速、高精度的要求,同时钢板的材质特殊,其延展性和韧性不同于普通的纸张和纱线,所以加大对钢板彩印机张力控制的研究将会进一步降低的成本,