基于深度学习的视频-骨架序列人体动作识别研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lixin200513137149
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在基于视觉的人机交互中,利用人体动作是非常有效的方法。然而动作是一个复杂的三维信号,在复杂的场景下高效稳定的识别人体动作仍然存在很多问题。针对人体动作识别问题,本文分别从视频序列、人体骨架序列以及二者的融合中提取动作时空特征,利用卷积神经网络识别分类。根据项目需求,本文研究内容主要分为以下几个部分:基于视频流的双通道卷积神经网络动作识别算法。针对现有的双通道卷积神经网络由于计算稠密光流速度缓慢的问题,提出一种在训练和识别过程中都是端到端的双通道卷积神经网络框架。网络包含空间和全局时域两个通道,对人体动作进行表征和识别。以MobileNetV2为基础网络,空间通道对动作图像进行深度学习,全局时域通道对能量运动历史图(Energy Motion History Image,EMHI)进行深度学习,然后将两个通道融合,并采用一种多帧融合的方法来提升准确率。基于骨架序列的卷积神经网络动作识别算法。基于视频的卷积神经网络模型对于场景的变化鲁棒性较差,并且不能在夜间识别。本文提出一种基于骨架序列的动作识别系统,首先对人体骨架序列进行视图不变变换以消除视点的影响,然后将变换后的序列编码到RGB空间,该编码方式可以完整表示人体动作的空间结构信息和时间动态信息,最后设计一个轻量化的卷积神经网络来识别编码后的RGB图像。基于多数据融合的时序动作检测算法。创新性的将时序动作检测问题转化为一维的目标检测问题,提出一种以YOLO为基础网络的双通道时序动作检测框架,该框架的输入融合了Kinect采集的视频和骨架序列。在视频通道,利用C3D特征提取器提取短时视频的高维特征。在骨架通道,对骨架序列进行视图不变变换。将两个通道的高维特征进行编码作为双通道目标检测网络的输入,最后设计两种方法将其融合。
其他文献
桥梁施工测量在整个桥梁施工的安全性能和使用寿命方面有非常关键的作用,要想做好这项工作,就一定要建立起健全的工程测量体系,这不但要求施工测量的控制网络系统具有较高的
目的:探讨钬激光治疗输尿管结石并发输尿管息肉的效果。方法:将2013-03~2015-03我院收治的输尿管结石并发输尿管息肉病人50例随机分为A(观察组)、B(对照组)两组,每组各25例,分别使
结合工程实例,对油漆库存在的环境风险进行识别。同时针对存在的环境风险,提出相应的风险防范措施,降低项目的环境风险,以使项目事故率、损失和环境影响达到可接受水平。
目前存储是IT领域中发展最为迅速的热点之一.究其原因,主要有两个方面:1、应用需求的牵引.数字化地球对巨量信息的有效存储提出了迫切的要求:
在民用飞机产品的设计阶段考虑产品的可维修性,利用JACK软件对机务维修任务进行虚拟仿真以及对维修的舒适性、可达性、可视性进行人机工效评估,验证产品的可维修性并提出改进
加强企业党风廉政建设,提升央企管理质量,则必须重视加强企业廉政文化建设,明确党建标准化工作,促进标准化理念与党风建设的有机结合;落实"八项精神",培养廉洁的党员队伍。本
民间美术属于传统文化中浓墨重彩的一笔。本文阐述了民间美术和审美意象的定义和特点,通过文化背景、创作精髓、构图布局、造型意象以及色彩特征几个方面着重探讨了民间美术
目的研究生姜根、番石榴叶、番石榴籽、橙皮、芝麻种皮、米糠和小麦胚芽等植物提取物的抗氧化活性和热稳定性。方法比较了乙醇、乙酸乙酯、三氯甲烷、正己烷和石油醚等不同溶
1 案例1.1 简要案情某年12月22日,陆某,女,55岁,因故倒地后,胸部先后被邢某、杨某骑坐并踩踏。伤后21 d,公安机关法医学鉴定意见为“陆某所受损伤程度为轻伤一级”。邢某、杨
详细介绍影响公路路基路面压实效果的主要因素,如含水率、碾压设备的型号与碾压方式等,分析公路工程路基路面压实施工技术的施工要点。