跨视角步态识别中去协变量与特征增强的研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:lity1021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于计算机视觉的生物识别逐渐成为一个重要的学术领域。在诸多生物特征中,步态以其难以伪装、远距离适用等特点在特定环境下具有优势。在真实场景下进行步态识别是具有极大挑战性的,需要克服观察视角变化、人体受到衣物及携带物遮挡等协变量的干扰。因此,本文以增强视角不变特征的表达为切入点,通过去协变量操作剥离遮挡物影响,展开跨视角步态识别方法的研究。其主要工作内容包括以下三个方面:1.为去除外观协变量的干扰,论文提出去协变量的跨视角识别模型(Gait De-covariate View Transformation Model,Gait-DVTM)。首先,制作步态能量图作为特征载体,采用半监督的方式训练编码器,在编码空间中通过对协变量空间置零剥离外观协变量特征;再基于奇异值分解的视角变换模块实现跨视角投影,最后,利用K近邻(K-Nearest Neighbor,KNN)算法完成识别。为解决视角变换模型对数据源要求角度多、无缺失的苛刻需求,论文进一步提出去协变量生成对抗识别模型(Gait Covariate-Removal GAN,Gait-CRGAN)。模型通过真假判别器与域判别器使生成器拥有提取有效特征和目标域投影的能力,并于生成器的编码空间中对协变量空间置零以生成目标域无协步态能量图。在CASIA-B数据集上进行实验,提出的Gait-CRGAN模型在正常行走(NM)、携带背包(BG)和穿着大衣(CL)三种状态的平均识别率分别达到62.76%、44.31%和30.45%,在后两种遮挡状态下的平均识别率与同类算法相比获得5%左右的提升。2.针对步态能量图缺少时序信息的缺陷,论文将步态轮廓序列作为输入。提出全局特征增强的Gait Part步态识别模型(Globa Feature Enhancement Gait Part,GFE-Gait Part)。设计局部与全局特征提取分支,其中,局部分支利用聚焦卷积增强局部微动作特征的表达,全局分支进行集合池化操作聚合步态周期的全局特征;其次,使用深度超参数化卷积核强化模型的特征提取能力;最后,采取改进的比例优化联合损失函数对模型进行强化训练。在CASIA-B数据集下对模型进行验证,NM、BG和CL状态分别达到95.873%、91.312%、79.5%的平均识别精度,在穿着大衣状态相较对比模型获得最高识别率。3.提出一种基于Transformer的跨视角步态识别模型。以Vi Vi T模型为框架提取步态序列的全局关联性。首先,综合考量模型的计算量与性能,选用时空分离的编码器架构,输入序列依次经过空间域与时间域编码器;其次,为降低视角协变量的影响,将视角信息嵌入空间域编码器生成的特征序列中;然后,为解决Transformer在小数据集上难以训练、易过拟合等问题,对每帧图像采用相同的空间位置编码以降低数据依赖,并通过引入改进的困难三元组损失与交叉熵损失组成的联合损失函数增加网络的学习难度。在CASIA-B数据集上进行实验,NM状态下平均识别精度达到58.30%,该模型验证了Transformer提取步态特征的可行性。
其他文献
伯特尔·奥尔曼是美国纽约大学政治学教授,是世界著名的正统马克思主义者,他对马克思的方法给予了极大的关注,并将“内在关系”视为马克思主义辩证法的核心,继而在重塑中得出了内在关系辩证法。从这一方法出发,构建了他的社会主义教育思想。奥尔曼的社会主义教育思想继承了马克思恩格斯、列宁等经典马克思主义理论家教育思想的衣钵,深受西方马克思主义理论家教育思想的影响,同时也离不开苏联社会主义运动受挫、无产者社会主义
学位
基于硅烯与石墨烯两种二维材料,本文分别建立了线缺陷硅烯纳米条带和应变石墨烯谷调控两种模型,研究了“5-5-8”环线缺陷对硅烯纳米条带的能带和量子输运的调控,应变对石墨烯谷分离和谷输运的调控作用。对于线缺陷硅烯纳米条带模型,采用紧束缚模型结合非平衡格林函数的方法,本文研究了亚晶格对称破缺的情况下,线缺陷硅烯纳米条带的输运性质和能带的调控性质。对于线缺陷硅烯体系,我们发现在体系的能带中,费米能级处会产
学位
学位
随着通信与网络技术的发展进步,人们已不再满足于对自身位置的定位导航,对生产、生活中环境和事物的监测需求也变得愈发迫切。GNSS全球导航卫星系统由于其全天时、全天候、无需发射源、覆盖范围广、时空分辨率高等优势引起了人们重视。在对GNSS信号多径效应的研究中发现其反射信号也能被接收和利用,GNSS-IR技术应运而生。近年来,这种具有广阔应用前景的新型被动遥感技术逐渐发展为卫星应用领域的一个研究热点。因
学位
基因调控网络描述了基因、蛋白质和其他生化基粒之间相互影响、相互制约的关系。它是一个高维的非线性动力学系统,具有丰富的动力学行为,如突发振荡、同步、分岔和混沌等。基因调控网络的动力学行为受多方面因素的影响,如基因间相互作用的连接拓扑、来自内部或外部的随机扰动以及生化反应过程中的时间延迟等。近年来,为了更加真实的理解基因调控网络的动力学特性,人们倾向于利用时滞微分方程来构建基因调控网络,并重点关注具有
学位
液滴在球面上的流动与传热过程,不仅在自然界中十分常见,而且广泛存在于各工业领域中,特别是在石油催化裂化过程中,惯性力作用下石油油滴撞击颗粒状催化剂后的形态与运动行为对石油催化裂化效率有重要影响。为深入研究裂化油滴撞击催化剂颗粒后运动行为的内在驱动机理,论文以省自然科学基金(LY15E060007)为依托,采用CLSVOF方法,利用动态接触角处理撞击后的液膜,基于Ansys Fluent平台,通过U
学位
Rayleigh-Taylor(RT)不稳定性是低密度流体加速高密度流体时,流体界面出现的现象。作为多尺度强非线性物理学中的一种,这种不稳定性现象广泛存在于自然现象(如卷云的形成、超新星爆发、地下盐丘)和工程应用(如超燃冲压发动机、惯性约束核聚变、气象学、海洋运动学)中,也是多相流体界面不稳定性、湍流混合等基础问题的理论基础。本文采用格子玻尔兹曼方法对微管道内三维单模不混溶瑞利-泰勒不稳定性的后期
学位
相机自运动估计旨在从图像序列中获取相机在三维场景运动过程中的相对位姿与轨迹。近年来,相机自运动估计在自动驾驶、机器人等领域中发挥了重要作用,已成为当前的研究热点。由于无监督学习不依赖于标注数据的质量和数量,在实际场景中具有更广泛的应用价值。因此,本文围绕无监督相机自运动估计的模型优化及其嵌入式部署开展研究。现已提出的无监督相机自运动估计方法通常基于视差、光流与相机位姿的联合优化策略。然而这类方法往
学位
随着新型互联网应用的崛起,全球视频流量持续高速增长,视频已经变成信息获取的一种很重要的方式,因此对于视频的压缩编码是整个视频行业高效发展的基础。新一代国际视频编码标准,通用视频编码(Versatile Video Coding,H.266/VVC)标准的正式版本已经于2020年7月发布,主要用于弥补上一代高效视频编码(High Efficiency Video Coding,H.265/HEVC)
学位
随着多样化移动设备的发展以及数字化水平的提高,大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)系统已经不能满足人们对网络速率的要求。随着技术的变革,无小区(Cell-Free)架构被提出,而无小区大规模MIMO是无小区架构的一种实现。无小区大规模MIMO系统具有消除边界效应和高吞吐量的优势,将会成为6G的关键技术之一。然而,在实际情况下,导频污染会影响系
学位