论文部分内容阅读
人们很早就通过手势进行信息的交互,手势是人们信息交互的重要方式之一。随着计算机技术的发展,人机交互的中心开始从计算机向人的方向转移。基于计算机视觉的手势识别方法能够提供更加友好的人机交互方式,是手势识别技术发展的趋势和目标。但是因为手势具有时间和空间上的多样性和不确定性,而且人手本身也是复杂的可变形体,所以目前这种人机交互方式还处于实验阶段,理论不是很成熟,能够识别的范围比较小,这是一个极富挑战性的多学科交叉的研究课题。基于视觉的动态手势识别的过程大致可分为手势分割、手势特征提取以及特征识别三个阶段。本文在已有的动态手势识别框架的基础上,主要做了如下三部分的工作:在手势分割阶段,本文改进了原有的分割流程,提出了基于卡尔曼滤波的手势位置预判与基于HSV颜色空间肤色聚类相结合的手势分割方法。此外,本文还采用基于人手肤色先验经验的自动白平衡以及基于R分量的动态差分分析等技术在复杂背景下进行手势的分割,与传统的基于RGB肤色模型的手势分割相比,取得了较好的分割效果。在手势特征的提取阶段,本文在分析了基于简易拓扑学以及归一化的傅立叶描述子的特征提取的方法的基础上,根据动态手势中不同的角度的手形具有不同意义的特点,在放宽手势特征值的标准,即不要求旋转不变。在此前提下,提出了边缘抽样统计的特征提取算法,并给出了这种特征值的二维图像意义。实验表明,在这种放宽的标准下,通过训练好的神经网络,这种算法具有速度快,识别率良好的特点。在特征的识别阶段,本文主要进行了轨迹识别以及包含手指位置信息的轨迹识别研究。在轨迹识别方面,本文借鉴成功应用在语音识别中的隐马尔可夫模型的方法,取得了较满意的结果。在包含手指位置信息的轨迹识别方面,本文提出了一种关键帧序列识别和轨迹识别相结合的方法,对三种手势进行识别,取得了90.3%的平均识别率。实验结果表明,这种方法具有一定的实用价值。