论文部分内容阅读
手语是人们生活当中一种自然而直观的人际交流模式,随着人机交互逐渐向以人为中心转移,对手语识别的研究也逐渐成为人们研究的热点。它为使用者提供了虚拟环境之间进行自然交互的手段,这是人们最渴望的人机接口技术。
然而,由于手语本身具有的多样性、多义性、以及时间和空间上的差异性等特点,加之人手是复杂变形体及视觉本身的不适定性,因此基于视觉的手语识别是一个极富挑战性的多学科交叉研究课题。
手语分为动态手势和静态手势,动态手势定义为手运动的轨迹,而静态手势强调通过手型传递一定的意义。本文研究的实时手势识别以特定的手型表示特定的意义,同时一定的动作产生一定的结果。
本文的实时手势识别和应用的过程大致分为五个部分:视频和图像的获取和预处理、手部区域提取、特征提取、手语的识别。
传统的手语识别方法基本都是利用离散的各帧静态图像进行识别,存在一定局限性,因此我们根据普通摄像头获得的视频图像,并采用方向直方图来获得单帧的静态特征矢量和各帧图像间的动态特征矢量,实现手语的识别。首先针对头两帧图像,通过手部边缘轮廓提取算法找到手的区域,然后从中提取出能表现手部形状的静态特征矢量。同时,对连续帧的图像做动作评估,获得手部移动的动态特征矢量。最后,将手部形状的静态特征与动态特征结合,采用欧氏距离作为矢量问匹配程度的度量算法以实现手语识别。实验对5个人的5种手语分别进行测试,均能正确识别,结果验证了该方法的有效性。