基于三维骨骼信息的手势识别算法研究及应用

来源 :南昌大学 | 被引量 : 0次 | 上传用户:rossh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时代的发展,我们对于人机交互方式的要求逐渐提高,在传统的精确性基础上不断追求自然性和舒适性。手势是人与生俱来的交互方式之一,它拥有极强的直观性,这使得基于手势识别的人机交互应用越来越热门,手势识别同样也在手语翻译、医疗辅助系统和手势操作等各方面得到了广泛应用。本文基于手势的三维骨骼信息对静态和动态两种手势识别问题展开了探讨,具体研究内容如下:首先,提出了基于肤色信息和深度信息的静态手势识别方法。传统的基于椭圆肤色模型的手势识别方法只依赖肤色信息分割,容易受到类肤色信息的影响,本文结合骨骼信息对肤色模型分割结果进行再次分割,优化手势分割效果;本文提出使用HOG和LBP融合特征对手部区域进行特征提取,得到具有代表性的静态手势特征;最后通过上述步骤采集静态手势数据集,采用SVM算法完成分类测试,实验结果显示本文方法具有更高的识别准确率。然后,提出了基于骨骼信息的动态手势识别方法。针对动态手势在时空范围内存在多变性的特点,本文提出了手势帧数统一化算法,可以统一动态手势的时间长度以便用于后续操作;然后从动态手势的局部特征和全局特征两个方面提出新的特征描述符,用于减小其特征表示的空间复杂度;针对单一分类算法可能的偏差性问题,利用自适应融合算法对各种基本分类器加以融合,输出更具鲁棒性的结果;最后在DHG-14/28数据集上进行实验验证了本文中动态手势识别框架的合理性和有效性。最后,提出了手势识别系统的应用。在充分利用前文研究内容的基础上提出了一种手势操作系统,该系统利用设定的静态手势表达对应的语义信息,再通过动态骨骼信息实现操作系统的实时响应。最后在电脑上对该手势操作系统进行测试,实现了快速准确的手势识别,能够满足人机交互实时操作,进而验证了前文算法有效性。
其他文献
光子计数单像素成像将光子计数技术和基于压缩感知的单像素成像结合,具有高灵敏、低成本的优势,在光学遥感成像、光谱成像、生物医学成像等领域有重要的应用。传统的重建算法存在采样时间和重建时间长的问题,近年来将深度学习用于压缩感知重建取得了重大的突破。基于深度学习的压缩采样和重建网络,将去除偏置和激活函数的全连接层作为测量矩阵,避免了传统迭代算法的带来的巨大计算量,从而实现了更快更高质量的图像重建。但利用
学位
作为量子密码学的一个重要研究方向,量子密钥分配旨在实现合法通信参与者之间安全地共享密钥。量子密钥分配协议一般要求所有通信参与者都具备量子能力,而且协议所涉及的多数量子设备都比较昂贵。Boyer等开创性地提出了适用于量子方和经典方之间的半量子密钥分配协议。为了避免半量子密钥分配协议中攻击者Eve冒充合法参与者Alice或Bob,需要对通信参与者进行身份认证。基于Cluster态和类GHZ态等纠缠态,
学位
作为测试系统参数,验证成像算法性能和分析干扰噪声的重要手段,SAR的回波仿真对SAR技术的研究有着至关重要的作用。针对SAR回波模拟方法设计,本文首先对SAR成像方法展开了分析。SAR回波模拟方法主要分为时域方法和频域方法。频域算法基于快速傅里叶变换的逆向处理,能够通过较低的运算量获得良好的分辨率性能。然而,频域方法通常需要满足方位向不变假设,因此频域方法的应用将受到平台构型的限制,无法适用于任意
学位
探地雷达(Ground penetrating radar,GPR)是利用天线发射和接收高频电磁波来探测介质内部物质特性和分布规律的一种地球物理方法,在工程勘察领域的应用日益广泛。在探地雷达反演中,信号中的强杂波严重影响了反演过程中地底目标成像的精度,并且传统反演方法大多数采用非线性迭代优化算法求解,面临着求解时间久、计算复杂度高和参数设置冗杂等问题。本文将以低秩稀疏分解理论为基础的杂波抑制与成像
学位
基于结构光条纹投影的成像系统因其无接触、高效率和高精度等优点,被广泛地运用于三维测量等计算成像领域。而结构光系统的非线性失真和光学畸变等因素降低了结构光三维测量的精度。本研究在结构光成像系统非线性模型的基础上,分析了各系统参数对展开相位估计精度的影响;提出了一种针对结构光三维测量系统空间几何畸变和光强非线性失真问题的预矫正方法;设计了一种实现结构光系统复合标定的快速方法。针对几何畸变和光强失真,建
学位
作为一门交叉学科,导航定位技术在地球科学、信息学科、智慧城市、物联网生活以及自动驾驶等方面发挥着越来越重要的作用。对于愈来愈复杂的现实场景以及定位需求,单一导航系统受自身的局限性影响,难以满足这些要求,组合导航随即成为导航定位研究的重点。组合导航将多种导航方法进行结合,通过组合手段抵消单一导航系统的不足,以此提高导航定位的精度以及性能。组合导航中的目标状态估计问题大多都是非线性滤波问题,常见的非线
学位
得益于无人机的低成本和灵活移动性,无人机已经被应用于各类复杂通信场景。传统的无人机通信轨迹规划都是将问题进行人工数学建模后进行优化求解,常假设信道模型为简单的视距链路(Lo S)或者概率Lo S,获得关于无人机位置的函数表达式后,再用凸优化技术进行路径规划。由于信道的时变性和无人机的移动性,传统的建模和描述过于简单,获得的轨迹无法指导无人机的实际应用。深度强化学习是一种在复杂的动态环境中进行最优决
学位
虚拟手术仿真系统可以对低年资医生进行临床手术培训,也可以针对病理进行术前手术预演,因此具有重要的研究价值。针对肾脏模型表面存在的黑空洞区域问题,论文提出了基于点云密度的修补方法,使得模型更加完整。后续针对传统球冠映射方法运用于不规则模型表面出现纹理映射模糊和重叠问题,提出基于区域划分球冠映射算法改善了模型表面的纹理效果。针对传统切割方法存在狭长状的切口问题,论文利用三阶贝塞尔曲线对不同切割情况的手
学位
在实际生活中,目标说话人的语音会被其他说话人的语音干扰。利用干扰后的说话人语音进行说话人确认时,说话人确认系统的性能会大幅下降。因此,多说话人语音的说话人确认工作包括两部分:对目标说话人语音进行提取和对提取出来的语音进行说话人身份的确认。本文主要研究基于深度学习的多说话人语音的说话人提取和确认方法,主要研究工作如下:(1)提出一种基于深度学习的注册说话人模型的说话人确认方法。该方法分别为每个注册说
学位
随着人们对地球以至于宇宙太空的探索,遥感技术得到很好的发展。无人机机载微波辐射计是微波遥感技术不可或缺的设备。早期微波辐射计的天线扫描依赖机械运动,扫描过程中机械振动带来的误差对设备测量精确度产生影响。随着漏波天线的提出,出现了一条解决该问题的全新技术路线。漏波天线是一类以行波传播,沿传播结构不断泄漏能量的天线,可产生窄波束,具有馈电结构简单、高定向性、低剖面等优点。其具有的频率扫描特性使得波束方
学位