基于视觉的手势识别算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:ncla02
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势作为一种人机交互模式,与传统的键盘和鼠标相比,在人机交互中具有更佳的舒适度,目前已被广泛应用于智能家居、机器人控制、手语识别等方面,成为人机交互领域的研究热点。与基于数据手套的手势识别技术相比,基于视觉的手势识别技术仅需要摄像头便能完成人机交互任务,无需佩戴接触式的数据手套,不会给人以束缚感,具有交互自然、简单方便的优点,成为手势识别的主流方式。基于视觉的手势识别技术利用单个或多个摄像头采集手势信息,采用特定的方法实现手势的识别。根据分类识别对象不同,可分为静态手势识别及动态手势识别。现实中手势交互背景环境复杂多变,不同的人表达同一手势时会有差异,这均为准确的手势识别带来困难,进而影响着用户体验。为了提高用户体验,构建一个鲁棒性较好的手势识别系统,本文对基于视觉的手势识别方法展开了研究。本文主要贡献如下:(1)静态手势分割方法手势分割是基于视觉的静态手势识别过程的第一个步骤,分割的效果影响着后期的手势分类结果。本文利用Kinect相机提供的深度信息结合手部的肤色信息进行手部分割,解决单目静态手势识别中存在的人手与复杂背景难以准确分离的问题。对于手部分割后存在冗余的手臂区域,本文创新性地采用距离变换操作并结合手掌分割圆,准确且快速地去除手臂区域。实验结果表明,该操作能够提高手势分类器的分类准确率。(2)静态手势识别方法对静态手势分割得到的手势二值图像提取特征并进行手势分类,本文探究不同的特征提取方式下手势分类器的分类性能。人工提取特征并输入到支持向量机进行训练,本文实现了一个传统的静态手势分类器。本文利用卷积神经网络对手势二值图像进行自动特征提取并分类,构建的手势分类器具有更好的识别效果。(3)动态手势识别方法本文利用3D卷积神经网络和卷积LSTM网络捕捉视频图像序列的时空特征,并利用SPP网络提取局部特征和全局特征,最终输入全连接网络实现了准确率高的动态手势识别。多模态视频图像序列作为动态手势分类器的输入,本文分别训练两种单模态网络并通过模型集成提高系统识别准确率,一定程度上避免了复杂背景环境的干扰。
其他文献
随着“一带一路”倡议和“人类命运共同体”理念的提出,已经有65个国家和地区响应与参加。不同民族文化间的交流越来越频繁,文化全球化已是必然的趋势,如何在文化全球化的进程中,保持本民族文化,提升本民族文化在全球文化中的地位和话语权,就显得尤为迫切。作为拥有悠长历史传承的中国文化,也面临着巨大的挑战和机遇。为了争取国际交流中的文化话语权,我国开始注重文化软实力的提升。动漫作为新兴的文化传播载体,是国与国
本文的主要研究内容为永磁动量球的自抗扰控制,采用欧拉角描述转子姿态,在永磁动量球进行大角度机动时存在奇异问题。为了解决这一问题,本文采用四元数描述永磁动量球转子姿
循环流化床锅炉炉膛水冷壁与耐火材料交接处的磨损一直是影响锅炉连续运行的一个重要因素,经过十几年的探索人们渐渐找到了一些行之有效的措施,这些措施为循环流化床锅炉的连续
对影响电站凝汽器压力的各种因素进行了综合分析,归纳了影响凝汽器压力的五个主要方面:凝汽器的密封性能、凝汽器的抉热性能、凝汽器蒸汽负荷及其品质、抽空排气器性能、循环水
随着社会经济和技术的发展,国内糖交易形式也得到长足发展,由传统现货交易形式发展到电子盘、期货及期权等先进交易形式,与国际基本接轨。2002年-2016年价格最低约2000元,最
重点分析了影响循环流化床锅炉运行周期的前期设备管理,控制风量,负荷以及锅炉防磨等运行中的问题,并提出了解决办法。
针对CG35/3.82-MX型锅炉在运行中出力不足、锅炉热效率低、烟气原始排放浓度高等问题,采用中科院工程热物理研究所北京通用能源动力公司的技术改造方案进行改造,取得良好的效果,改
在进行VSP测井的处理和解释工作中,求取地层VSP速度是一项关键工作.速度的精度直接影响之后的地质研究认识。为保证速度求取的准确,通常将声波速度与求取的VSP速度进行对比,而在
本文基于单程波方程进行VSP正演模拟方法研究,该方法可以直接模拟出上行波,省去波场分离处理。用文中方法对不同模型的理论试算表明,地震合成记录的反射波清晰,没有多次波、
为了解既有裂缝对钢筋混凝土T形梁受力性能的不利影响,进行了5根带裂缝(裂缝宽度0.3mm~0.4mm)混凝土T形梁受力性能的对比试验研究。重点研究了既有裂缝对混凝土T形梁受力性能的