基于深度学习的人体动作识别研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:dfsdfsafdsfds
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别是计算机视觉领域中一项重要且具有挑战性的任务,基于骨骼的人体动作识别由于人体骨骼数据的鲁棒性和易获取性在该领域引起了广泛的关注。近年来,随着深度学习的发展,利用图卷积网络将人体骨骼建模成时空图来探索人体关节的内在联系,取得了显著的效果。然而,现有方法忽略了关节之间的远程依赖关系,固定的时间卷积核会导致时间建模缺乏灵活性,而且现有模型往往过度参数化,加大了计算成本。针对这些问题,本文基于深度学习中的图卷积网络和人体骨骼数据,提出了改进的动作识别模型,主要内容如下:(1)对于忽略关节间远程依赖和时间建模缺乏灵活性的问题,本文提出了一种多尺度自适应聚合图卷积网络模型,来进行动作识别。首先,设计了一个多尺度的空间图卷积来聚合骨骼数据的远程依赖和多阶语义信息,并综合建模人体关节的内在关系进行特征学习。然后,提出多尺度时间卷积模块自适应地选择不同时间长度的卷积核,以获取更为灵活的时间图。此外,还增加了时空通道注意力机制,以获得骨骼序列中更有意义的关节、帧和通道信息。最后在各模块间引入了残差连接对特征信息进行复用。通过在三个大规模公有数据集(NTU RGB+D60、NTU RGB+D 120 和 Kinetics-Skeleton)上的实验,结果表明,本文所提出的模型实现了良好的识别性能。(2)对于模型过于复杂和参数量过大的问题,本文构建了一个轻量级的多尺度时空图卷积网络模型。首先利用分层策略对原有的多尺度空间图卷积模块进行改进,并引入了膨胀卷积到时间卷积模块,在不改变卷积核大小的情况下获取到更广域的有效感受野。然后使用深度可分离卷积来替代标准卷积,来降低参数量以及提升模型的训练速度。此外,提出了一个时空位置注意力模块来发现整个骨骼序列中特定帧中信息量最丰富的关节,从而增强模型在不同动作序列中提取判别性特征的能力。最后采用多流数据融合的方式来增加输入数据,扩充网络中的特征信息。通过大量的消融和对比实验,本文所提出的模型可以在较低参数量的情况下实现好的识别准确率,证明了该模型的优越性。
其他文献
在能源需求量与日俱增,化石能源日渐枯竭的当下,固体氧化物燃料电池(Solid Oxide Fuel Cell,SOFC)由于污染小、效率高等优点,受到了广泛关注。本文以阳极支撑平板式SOFC为研究对象,研究了宏观结构、操作条件对电池性能的影响,耦合了传热传质、流体流动和电化学反应,在COMSOL中建立了三维非等温模型并进行了求解计算,从输出性能、温度变化、气体扩散等方面进行了分析讨论,归纳总结了其
学位
主动再生冷却技术是一种用于超燃冲压发动机的热防护技术。其中碳氢燃料在超临界状态下,流经冲压发动机外壁面内的微小通道,对发动机进行冷却,同时完成碳氢燃料的预热,燃烧效率得到提升。超临界状态下碳氢燃料的热物性随着温度发生剧烈的改变,研究微小通道内超临界碳氢燃料的对流换热特性与机理,对于主动再生冷却技术的应用与发展具有重要意义。本文通过数值模拟方法,以超临界碳氢燃料航空煤油(RP-3)在不同流道截面冷却
学位
随着能源需求问题的日益突出和工业技术的飞速发展,传统纯流体由于导热系数较低而无法满足先进热科学领域的工业需求。纳米流体作为一种新型的换热工质,有望解决此类问题。在纳米技术日益进步的过程中,人们不应忽视磁场对纳米磁流体的影响,例如生物工程中利用磁源来改变磁流体的流动方向。本文研究了Cu O-H2O纳米流体的自然对流,以阐明磁场对纳米流体流动和传热的影响。由于其微观本质和介观特点,格子Boltzman
学位
目的:观察中药穴位敷贴专项护理应用于支气管哮喘(BA)患儿的效果及对免疫功能的影响。方法:选取94例BA患儿,按随机数字表法分成2组各47例,对照组为常规干预,观察组为中药穴位敷贴专项护理。分析2组患儿临床疗效,并比较干预前后圣乔治呼吸问卷(SGRQ)评分及免疫功能。结果:观察组总有效率为95.74%(45/47),对照组总有效率为74.47%(35/47),观察组总有效率显著高于对照组(χ~2=
期刊
聚合物-液晶复合材料由于其良好的稳定性与调控性,以及在显示、光电子及生物医药等领域的应用前景,引起了研究者们强烈的兴趣。作为其中的一类,液晶-聚合物模板体系,由于特有的“清洗-再填充”特性,赋予其极大的灵活性,扩大了聚合物-液晶复合材料的应用范围。各种基于该体系的新型光学器件层出不穷,打破了传统单一的电场调控方式,实现了器件光学性能调谐的多样化。而基于光引发聚合体系的全息聚合物-分散液晶体系更是在
学位
半导体激光二极管已经包括了从太赫兹到紫外的广阔波段,在工业、交通、通信、信息处理、医疗卫生以及文化教育等多种领域都有着非常重要的应用。本文所研究的就是对用Ⅲ族氮化物半导体材料设计的深紫外激光二极管(Deep Ultraviolet Laser Diode,DUV-LD)的性能进行优化。由于Ⅲ族氮化物材料的激光二极管具有可以直接包含蓝光、绿光、紫光和紫外光的比较大的禁带宽度,并且它的发光特性远远优于
学位
传统对企业经营状况分析主要以企业的财务报表为基础,而财务报表一般只有上市公司才会公布,因此在缺乏财务报表情况下难以利用传统方法判断企业的经营状况。目前对此方面的研究较少,因此本文基于数据挖掘方法对企业经营状况分类,同时挖掘出影响企业经营的重要因素,研究具有一定的应用价值。首先分析企业经营相关的发展现状并且记录下可能影响企业经营的潜在因素,其次利用Python爬虫爬取数据构建企业数据集,再次经过数据
学位
本文介绍了在传统溶剂催化液化的基础上增加等离子体技术液化剩菜剩饭的一种新型转换工艺,具有液化时间短,效率高,装置简单,能耗低等优点。实验主要研究了等离子体电解液化剩菜剩饭的反应途径和催化机理。实验前,我们首先对等离子体电解特性做了研究,放电模式从最初的丝状辉光放电转换为火花放电,电压电流曲线也出现两个明显趋于稳定的变化,这主要是由于剩菜剩饭中含有大量水分。在等离子体电解液化实验过程中,我们探究了一
学位
改革开放成功地激发了企业活力,中国市场经济逐渐繁荣,但是许多企业在追逐利润的过程中未履行相应的社会责任,导致企业与其他个体之间的冲突加剧。随着环境污染、财务造假、员工压榨、产品安全等社会问题不断被曝出,企业社会责任(以下全文简称为“CSR”)逐渐走进人们的视野。而管理层作为公司战略制定与执行的决策者之一,其权力特征不仅决定了企业行为是否贯彻管理层意志,同时也会对管理层自身的行为产生影响,这些最终都
学位
随着工业科技水平的提高,显示技术的急速发展逐渐模糊了图像与真实世界之间的界限。通过分析二维图像背后隐藏的三维信息,生物大脑可以根据图像中的特征信息来自组织构建三维立体模型。为了更好的凸显二维图像中的高维信息而引入视错觉复现系统,其对提升三维成像效果具有不可忽略的影响。本文针对视错觉复现系统在三维成像系统中的应用涉及到的关键技术,首先介绍视错觉生物机理,重点分析了视神经细胞感受野,特别针对其具有方向
学位