基于结构光的手势识别技术鲁棒性研究

来源 :东北大学 | 被引量 : 2次 | 上传用户:hurusato09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着当代计算机技术的发展,人与计算机之间的交互变得越来越人性化、简便化,手势作为一种自然的人机交互手段,广泛地引起了研究者们的关注。手势识别技术主要研究对手势的检测与识别,实现拟人化的人机交互,可以应用到机器人运动控制和手语识别等方面。目前,最常用的两种手势识别的方法是基于穿戴式传感器的手势识别方法和基于视觉的手势识别方法。基于穿戴式传感器的手势识别方法需要戴一个类似于手套的传感器设备,有时候可能会给用户带来不便(比如出汗),而且较为昂贵。而基于视觉的手势识别方法,利用摄像头非接触式地捕获手势的动作,交互方式比较自然,传统的基于视觉的手势识别技术捕获的是手势的二维图像,容易受到背景、视角、光照等因素的影响。本文对传统的基于视觉的手势识别技术进行了改进,提出了一种基于结构光的手势识别技术,利用kinect类3D深度相机扫描手势,获取手势场景的三维信息,进一步构建手势表面的点云数据,再对三维点云进行深度过滤,利用最近目标法提取出手势的感兴趣区域(ROI),然后应用肤色检测技术对手势进行定位,再应用Adaboost算法对手势进行识别。为了提高检测方法的鲁棒性,本文定义了“拳”和“掌”两种手形,应用Adaboost算法分别对“拳”和“掌”两种手形进行识别,均有很好的识别效果。经感兴趣区域提取、肤色检测和Adaboost识别这三步,本文精确地提取出了“拳”和“掌”两种手形的手势区域。为了进一步实现对动态手势的识别,本文定义了“上”、“下”、“左”、“右”和“对号”五种手势,使用隐马尔科夫模型(HMM)对五种手势进行识别,识别效果都很好。实验结果表明:基于结构光技术的kinect类3D深度相机能快速地捕获手势场景的三维信息,且不用过分考虑纹理和光线环境;经感兴趣区域提取、肤色检测和Adaboost识别三步,本文精确地提取出了“拳”和“掌”两种手形的手势区域,提高了系统的鲁棒性;使用HMM模型分别对“上”、“下”、“左”、“右”和“对号”五种手势进行识别,基本上达到了动态识别的实时性。这些都表明本文算法具有快速、精确、分辨率高、实时性好、鲁棒性好、手势区域易于提取等优点,而且结构简单、价格不高且易于实现。
其他文献
经济预警是对经济运行状况的认识和判断,其研究结果直接影响宏观调控政策的合理制定,不仅是经济学的重要研究领域,而且倍受各国政府和公众的普遍关注。但是,传统预警方法主要建立在专家经验或简单的统计学模型,难以反映高度非线性的经济系统的本质,无法满足宏观经济预警的客观要求。本文在对国内外宏观经济预警概述的基础上,阐述宏观经济预警理论体系中预警指标体系的设计、预警模型、预警系统建立等方面的问题;深入分析了人
一年级阶段是儿童从幼儿园教育步入学校教育的转折期,其教育方式也有不同。幼儿园的教育以玩耍、活动和游戏为主;而小学教育则是以“学”知识为主,还要受到一定的纪律约束。
随着“三个代表”学习与实践不断深入,越来越多的机关干部走出办公室下到乡镇、农村,跑项目、争指标、筹资金,忙活得有声有色,情真意切帮助农村搞建设,求发展。但也有一些人
本文中,我们将半群的夹心集概念推广到Γ-半群上,研究了它的基本性质和一些应用.全文分为三章:第一章讨论Γ-半群的基本性质,夹心集是印度数学家K.S.S.,Nambooripad在创立正
■“位、为、威”是领导干部身份、作为、威望的一种集合,它既是领导干部综合素质的体现,更是检验一个人党性观念强不强,群众基础好不好的试金石。因此,辩证看待“位、为、威
没有任何耗散的自由波动方程是一个守恒律系统,也就是说,它的总能量在任何时候都是固定的。一些作者研究最小扩散,使得当时间趋近于无穷时,相应的扩散波动方程的解一致衰减到零。
变分不等式和互补问题广泛应用于阐述和研究物理学、力学、经济学、运筹学、最优控制等数学模型以及交通运输中出现的各种平衡模型。因此研究其快速数值解法是很有意义的。近
组合设计是离散数学的一个重要的分支,特别是由于组合设计的理论和方法在数理统计,运筹学,信息论和计算机科学中的重要应用,组合设计的研究进入了一个飞速发展的时期。区组设计是
时滞系统在控制系统中占有重要的地位,在社会中具有普遍意义并广泛存在.时滞的存在不仅可能导致系统性能降低,还可能导致系统失稳,这使得时滞系统稳定性的研究一直都非常迫切和
X是2k-1维光滑射影簇,f_R:X→Y是小收缩映射,如果例外集E的维数为k,那么在特定的条件下E是若干个k维射影空间的并。