论文部分内容阅读
随着当代计算机技术的发展,人与计算机之间的交互变得越来越人性化、简便化,手势作为一种自然的人机交互手段,广泛地引起了研究者们的关注。手势识别技术主要研究对手势的检测与识别,实现拟人化的人机交互,可以应用到机器人运动控制和手语识别等方面。目前,最常用的两种手势识别的方法是基于穿戴式传感器的手势识别方法和基于视觉的手势识别方法。基于穿戴式传感器的手势识别方法需要戴一个类似于手套的传感器设备,有时候可能会给用户带来不便(比如出汗),而且较为昂贵。而基于视觉的手势识别方法,利用摄像头非接触式地捕获手势的动作,交互方式比较自然,传统的基于视觉的手势识别技术捕获的是手势的二维图像,容易受到背景、视角、光照等因素的影响。本文对传统的基于视觉的手势识别技术进行了改进,提出了一种基于结构光的手势识别技术,利用kinect类3D深度相机扫描手势,获取手势场景的三维信息,进一步构建手势表面的点云数据,再对三维点云进行深度过滤,利用最近目标法提取出手势的感兴趣区域(ROI),然后应用肤色检测技术对手势进行定位,再应用Adaboost算法对手势进行识别。为了提高检测方法的鲁棒性,本文定义了“拳”和“掌”两种手形,应用Adaboost算法分别对“拳”和“掌”两种手形进行识别,均有很好的识别效果。经感兴趣区域提取、肤色检测和Adaboost识别这三步,本文精确地提取出了“拳”和“掌”两种手形的手势区域。为了进一步实现对动态手势的识别,本文定义了“上”、“下”、“左”、“右”和“对号”五种手势,使用隐马尔科夫模型(HMM)对五种手势进行识别,识别效果都很好。实验结果表明:基于结构光技术的kinect类3D深度相机能快速地捕获手势场景的三维信息,且不用过分考虑纹理和光线环境;经感兴趣区域提取、肤色检测和Adaboost识别三步,本文精确地提取出了“拳”和“掌”两种手形的手势区域,提高了系统的鲁棒性;使用HMM模型分别对“上”、“下”、“左”、“右”和“对号”五种手势进行识别,基本上达到了动态识别的实时性。这些都表明本文算法具有快速、精确、分辨率高、实时性好、鲁棒性好、手势区域易于提取等优点,而且结构简单、价格不高且易于实现。