基于图神经网络的人体骨骼行为识别

来源 :江南大学 | 被引量 : 0次 | 上传用户:cdhanks1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体行为识别是计算机视觉领域的重要方向,相关技术日益成熟并广泛应用。依据输入数据源不同,人体行为识别可分为基于RGB视频数据的行为识别、基于骨架数据的行为识别等,本文研究基于骨架数据开展。以骨架数据作为输入可缓解目标遮挡、视角差异、背景变化等问题,因此基于该类型数据的行为识别近来备受关注。当前基于骨架数据的研究仍存在瓶颈。首先,相关课题侧重于骨架空间特征的优化,而缺少时序上的全局依赖性,导致原子动作特征的语义关联弱,且特征冗余程度高致使模型精度因堆叠模块迅速趋于饱和。其次,相关研究少有多人交互特征的提取方案,且存在较严重单人行为与多人行为类别混淆的缺陷。最后,现有模型缺乏多粒度时序特征建模,许多方法预定义的小卷积核难以关注到速率变化不同的动态模式。围绕上述三点问题,论文的主要工作以及形成的研究成果如下:(1)提出了基于Transformer建模时序依赖的骨架行为识别方法。该方法设计了自注意力特征编码模块(transformer encoder,TE),通过挖掘上游时序特征相似性获取长程时序依赖,以关联全局帧级语义信息。此外,引入了残差结构降低堆叠TE模块引起的网络退化风险,定义了特征时序冗余度以定量分析不同结构的效率差异,设计了包含侧向连接(lateral connection,La C)的并联结构以减少模型参数量并保持精度。(2)提出了面向多人物交互行为的骨架行为识别方法。该方法定义了人物维度上的标准化操作(M-layer normalization,M-LN),避免预处理阶段引入噪声,增强人物数目区分效果。构建了扩展的TE模块(extend transformer encoder,E-TE),通过建模人物间行为关联性提取交互特征。设计了渐进式多目标学习方案(gradual multi-task learning,GMTL),以增强网络判别样本内人物数目的能力。(3)提出了基于多粒度时序信息融合的骨架行为识别方法。该方法设计了分支结构的多粒度时序信息编码模块(multi-scale temporal embedding modules,MT-EMs),各分支以不同尺寸卷积核提取多种粒度的动作变化信息,兼顾不同动态模式。并提出了完备的多粒度提取时序依赖的骨架行为识别模板方案(multi-scale temporal transformer,MTT)。本文对所提出的方法均进行了消融实验验证其提升效果,且对网络设计包含的超参数进行调整选取合理的网络结构。实验结果表明,上述方法具有良好的通用性和有效性,并于NTU-RGBD 60、NTU-RGBD 120、Kinetics-Skeleton 400三个大数据集上取得了较好的效果。
其他文献
为落实我国医疗体制改革发展的要求,应对人口老龄化趋势,特别是疫情对疾病监测管控所提出的新的时代命题,医疗卫生机构需加强疾病预防、疾病筛查和疾病控制,通过信息化手段构建医患互动或居民个人的健康管理模式,降低疾病发生率。对通信运营商而言,在现有短信、语音、流量、宽带和增值服务较难提供更多利益增长点的情况下,需整合资源和补强能力实现竞争力的突破。在此背景下,A企业作为通信运营商的专业子公司,承担医卫行业
学位
随着数字技术、移动互联网技术的不断发展,智能移动设备逐渐普及,短视频应运而生,改变了人们信息接收的方式也改变了人们的生活。近年来,在体育强国等政策的支持下,越来越多的体育自媒体人投身短视频平台,借短视频的势头传播体育。本报告是笔者根据本人创建并运营的微信视频号“女排纪念册”的亲身实践经历,针对该微信视频号的创建背景、内容策划与生产流程、运营推广等方面进行的阐述,并在报告中选取了三个具有代表性的短视
学位
研究目的:再灌注损伤是恢复血液流动和组织氧合后缺乏血流和缺氧的器官所表现出的自相矛盾的组织反应,已经成为基础和临床研究的重点,已有超过40年的历史。尽管已经提出了多种分子机制来解释这种现象,但是作为再灌注损伤发生的关键因素,活性氧(ROS)的过量产生仍受到广泛关注。心脏缺血和再灌注引起严重的心肌炎症,导致细胞损伤和组织功能障碍。在这一炎症过程中,活性氧(ROS)形成,可能显著促进心肌损伤。有证据支
学位
制造业是国民经济发展的支柱产业,中国政府提出的《中国制造2025》行动纲领,目标是实现“制造大国”向“制造强国”的跨越发展。当下制造性企业不但正处于时代变化的浪潮之中,还面临着不断变化的客户需求,激烈的行业竞争以及急速上升的成本压力,因此企业通过数字化生产管理提升企业的竞争力也就势在必行。为了推动制造业向数字化转型,各个国家均发展了数字化生产管理的基本理论体系。我国结合数字化的定义,提出了信息物理
学位
研究目的:新课程标准中的体育课程目标要求通过培养学生的体育知识,发展学生的体育核心素养。随着“健康第一”、“教育现代化”、“弘扬体育育人功能”、“终身体育”等体育教学理念的更新,越来越多的新型体育课程模式强调体育课程不仅应包含运动技能的学习,更应重视体育理论知识的学习。目前我国儿童普遍存在身体活动水平不高并且随着年级的升高逐年下降的问题,而学生的体育学习兴趣也随着年级的上升逐年递减。当前有许多研究
学位
随着产业及技术不断发展,学界对于传媒创新的讨论和业界对于媒体创新的实践一直在持续。可以发现的是,目前学界业界对于网络体育媒体的创新话题多数都聚焦在内容生产、分发方面的提升或改变,属于持续性创新范畴。但已有学者开始呼吁,对于网络体育媒体所面临的发展困境,也需要从颠覆性创新的角度出发去探讨。新浪体育在2014年国务院颁发“46号文件”前后陆续失去了作为网络体育媒体发展核心资源的大型体育赛事转播权,面临
学位
目的:塞内卡病毒作为一种新兴的溶瘤病毒,该病毒能够有效选择并破坏诸如人小细胞肺癌、视网膜母细胞瘤等具有神经内分泌性质的癌症。但仍不清楚其能否破坏其他类型的癌症,尤其是口腔鳞癌作为全球发病率前十的恶性肿瘤,也没有证据显示该癌症可以被塞内卡病毒破坏。为了探索口腔鳞癌新的治疗方法并拓展塞内卡病毒的在溶瘤领域的应用,本研究以舌鳞癌细胞系CAL-27(Oral Squamous Cell Carcinoma
学位
描述化疗期间发生跌倒的肺癌患者的临床特征,分析跌倒的原因,为预防肺癌患者化疗期间跌倒及降低跌倒发生率提供防范措施。研究表明,护理管理人员应完善约翰霍普金斯风险评估量表评估内容,增加化疗方案、脑转移及症状的相关评估内容,或将高风险项目纳入自定义项目中,以保证该评估量表更具特异性及临床使用价值。同时要加强护士和患者跌倒预防相关知识培训,制定防范措施时应充分考虑患者夜间活动行为的管理以及化疗期间的注意事
期刊
近年来,随着互联网的快速发展,由视频剪辑、图像、文本等多种类型的数据构成的多媒体数据无处不在。如何从这些多媒体数据中获得丰富的信息和宝贵的价值引起了学术界和工业界的广泛研究,跨模态检索算法应运而生。人们对跨模态检索进行了各种各样的研究,该算法的目的是当给定来自一个模态的数据对象作为查询时,可以从另一个模态获得所需的相关对象,所提供的结果能够帮助用户获取有用的信息。跨模态检索方法存在一个基本问题,即
学位
分娩镇痛,广义上包括药物性(椎管内阻滞、静脉注射、肌内注射阿片类镇痛等)和非药物性(导乐陪伴、经皮电神经刺激仪、针灸按摩、水中分娩等),能够促进、支持和保护自然分娩,改善分娩体验。分娩镇痛技术涉及妇产保健、麻醉、护理等学科领域,具有多学科、多层次、复杂性的特征。单一学科的医疗专业人员(Healthcare Professionals,HCPs)难以完全满足孕产妇对分娩镇痛决策的信息需求,多学科HC
学位