论文部分内容阅读
手势识别是新一代人机交互所不可缺少的一项关键技术,它通过摄像机捕获用户的手势动作,并由计算机程序进行分析理解,再转换成计算机指令完成交互任务。这种交互方式摆脱传统键盘鼠标的束缚,更加符合人类自身的习惯,因而具有广泛的应用前景。现有的手势识别方法可以分为静态手势识别和动态手势识别两大类。其中动态手势识别的识别对象是一组连续的手势动作,动态手势对应着模型参数空间里的一条轨迹,由一段时间范围内的一系列静态手势所构成,并包括手在空间中的旋转和位移运动。实时动态手势,又不同于一般的动态手势识别,因为它实时的特点,要求系统在识别的时候能有很高的效率,以及能抵抗可能出现的各种干扰,目前在这方面的研究中,还没有成熟的理论和模型,现有方法鲁棒性不高、实时性不强。本文首先简要介绍手势识别技术的分类和一般的处理流程,以及研究现状和存在的困难与挑战。接着介绍了手势图像预处理技术,按照静态和动态两种手势类型,给出了相应的手势分割方法。考虑到动态手势的一般有如下三种情形:只考虑手形变化、只考虑运动轨迹、手形变化与运动轨迹相结合,我们在手势特征的选择和提取阶段,针对上述三种情况,分别选取了三种的特征提取技术:第一种是静态手势特征提取,我们主要介绍了基于结构和基于傅里叶描述子的两种提取方法;第二种是基于运动跟踪的动态手势特征提取,这种方法适用于提取手势的运动轨迹;第三种方法是基于光流的动态手势特征提取,这种方法使用图像运动估计的理论,能反映图像中运动和变化的部分的特征,可用于既有手形变化,又有运动轨迹的动态手势识别。最后,提出本文所采用的识别方法,我们通过光流计算提取手势特征,并采用DTW(动态时间规整)技术来完成手势识别。DTW能很好的消除因为手势执行时间差异所造成的匹配误差,同时相比HMM模型,训练更加简单,但是运算比较复杂,效率不能满足实时性要求,我们对其加以优化,并提出了最终的算法。通过实验验证,证明这种方法是行之有效的。