基于3D CNN的人体连续动作识别

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:q_yong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体连续动作识别是服务机器人进行人机交互的基础,对服务机器人的发展起着至关重要的作用。目前对于动作识别的大量研究主要针对单个完整动作的识别,对于连续动作识别的研究相对较少,同时传统的机器学习对于动作序列特征提取的不足也限制着动作识别领域的进步。近年来深度学习逐渐兴起,由于深度学习自动学习样本集特征的能力,各个领域都掀起了研究深度学习的热潮。本课题结合当下最火热的深度学习展开对连续动作的识别,设计了一个改进的3D CNN(卷积神经网络)混合模型,为解决人体连续动作的识别难题提供一种解决方式。针对连续动作难以识别问题,本文在进行网络结构设计之前,对动作序列进行了一系列的预处理,分别对原始样本提取灰度特征,运动特征和边缘特征。在运动特征提取方面,由于稠密光流的计算量大,L-K稀疏光流法对大运动难以捕捉等问题,设计了一种使用卷积核改进的L-K光流法来对运动特征进行提取。在边缘特征提取方面,由于在网络训练前需要对图像进行分辨率的统一,在重采样过程汇总会造成边缘特征模糊问题,故增设了边缘特征通道,使用了Gabor滤波器对图像序列中的纹理进行凸显。图像预处理形成多通道之后,对各个通道设计3D CNN网络结构,针对通道数过多,如果直接将各个通道的网络特征进行串联,计算量过大而且会造成部分特征模糊。于是利用离散小波变换将边缘特征通道和运动特征通道进行整合,提高了网络整体的性能。在通过深度网络提取特征之后,设计了多个分类器对动作序列进行识别分类,确定了3D CNN与SVM结合的混合模型对动作识别表现优异。并针对该混合模型进行了各网络层的特征可视化,深入理解了各网络层的操作过程。本文将设计的混合模型运用于人体连续动作识别上,由于训练样本选取的是片段式动作,所以在训练过程中不需要预先划分动作再进行识别,只需要收集一定帧数即可去识别,为人体连续动作识别方面提供了一种很好的解决方法,具有很好的实践意义。
其他文献
[目的]探讨基于老年综合评估指导下的针对性护理对老年糖尿病患者的护理效果.[方法]选择2017年1月至2019年10月本院收治的130例老年DM患者,根据随机数表法将其分为观察组(应
摘要:近几年,新疆的学前教育得到了国家政府的高度重视和大力支持,尤其是南疆的学前教育,有了突飞猛进的发展。口语交际能力的重要性在幼儿园的师幼互动中显得尤为重要,它是幼儿教师必备的专业技能之一。但就目前的“五年一贯制”学前教育专业口语交际教学来看,还存在语文口语交际教学受重视程度不够、缺乏专业特色等诸多亟待解决的问题。  关键词:“五年一贯制” 学前教育专业 口语交际教学  中图分类号:H193.2
古诗词字字珠玑,蕴含着深厚的文化意义,彰显着语言之美.那么,在小学古诗词教学中,如何引领学生走到文字背后,感悟诗词的深度,体悟诗词之美?以《渔歌子》为例,简要阐述我的探
期刊
本课题主要研究了热风微波耦合干燥技术的特性,探讨了热风与微波同时干燥物料设备和技术的可行性,研究了各个因素对干燥产品品质的影响,对干燥工艺参数进行了优化,并对热风微
在图形类证明和计算题中,如果能做到答题步骤合理、逻辑清晰、书写规范,不仅能有效避免失分、获得满分,也能使思维条理化,有利于归纳解题通法,领悟数学思想,从而快速、高效地
期刊