基于深度特征融合的动态手势识别

来源 :天津大学 | 被引量 : 0次 | 上传用户:zq09171
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势识别已成为人机交互领域中重要的研究课题之一。其中动态手势识别在家庭娱乐,智能驾驶等非接触式遥控方面有诸多应用。随着Kinect等深度摄像机的出现,基于深度图像的动态手势识别吸引了众多研究者。深度图像有对光照条件不敏感等诸多优点,使得动态手势识别准确率有了明显提高。但动态手势由于遮挡、个体差异以及时空变化等特点使得动态手势识别依然很有挑战。  针对动态手势的特点,本文提出了基于形状与时空深度特征融合的动态手势识别方法。对于形状特征,考虑计算深度运动图得到手的3D结构和形状信息,然后提取深度运动图的局部二值模式直方图和边缘方向直方图特征获得动态手势深度序列的局部纹理和边缘信息,得到DLE特征。DLE融合时空特征HOG2得到的描述子定义为DLEH2。考虑到DLEH2获得的形状信息在空间和时间上不够细致,为了得到多尺度的形状信息,考虑首先在时间层次金字塔深度运动图上提取局部二值模式直方图和金字塔方向梯度直方图特征,得到的描述子定义为PDMM-LBP-PHOG,再将PDMM-LBP-PHOG与HOG2融合得到多尺度描述子定义为PDLPH2。将两种描述子DLEH2和PDLPH2分别与线性SVM分类器结合在公开具有挑战性的MSRGesture3D和SKIG动态手势深度数据集上进行实验评估性能。DLEH2在MSRGesture3D和SKIG上分别得到99.10%和98.43%的识别率,PDLPH2在SKIG上得到98.89%的识别率。实验结果表明就识别率而言提出的描述子均优于最新水平的算法,多尺度的PDLPH2的性能比DLEH2更强。同时,融合后算法性能比单独使用任何单一特征的性能更好。  综上,本文提出的描述子对动态手势识别具有较强的辨识力和鲁棒性,表明本文提出的基于形状与时空深度特征融合的动态手势识别方法的有效性。本文提出的描述子可应用于智能驾驶等人机交互领域。未来可以考虑融合RGB等模态的特征进一步提高算法性能。
其他文献
随着网络的迅速发展和互联网应用的普及,网络已成为人们日常工作生活中不可缺少的信息承载工具。网络技术的迅猛发展使人们对网络技术日益依赖的同时,也使得网络安全问题突显
学位
学位
云环境中同驻虚拟机间由于共享物理资源,使得一些恶意云用户通过探测、分析共享资源的信息来隐蔽地获取其他云用户的私密信息,引发侧通道攻击威胁,从而使云环境中的同驻虚拟
随着我国经济的高速发展,城市化的步伐加快,中国的许多大中城市开始出现城市蔓延。这主要是由于城市用地的快速扩张和无序开发引起的,因此中国城市化面临的一个主要问题就是
工作流技术以其在实现业务流程的自动化上的优势而成为一个新兴技术亮点。业扩报装系统是电力企业安全稳定运行的重要保证。在对工作流理论和标准进行深入研究的基础上,本文
三维游戏技术目前已经广泛应用于各种研究领域,如虚拟现实系统、汽车模拟训练系统及军事仿真系统等。它推动诸多领域的发展,并已经成为当今的研究热点。基于三维游戏技术的重
电脑横机是一种由电脑控制的自动化程度很高的横编针织机械,主要用于羊毛衫等针织服装以及工艺品的编织制造行业。   电脑横机控制器是整个电脑横机系统最核心的部分,合理的
文字是人类信息交流的主要载体之一。随着计算机信息技术的高速发展,使用计算机处理并识别文字信息也就成为了一个非常重要的研究和应用领域。光学字符识别OCR(Optical Chara
无线传感器网络是一种全新的信息获取和处理技术,它将逻辑上的信息世界与客观上的物理世界融合在了一起,作为未来实现“普适计算”的一种新型技术,无线传感器网络在越来越多