论文部分内容阅读
目前,基于视觉信息对手势进行自动的识别已经越来越多地应用于人机交互中。基于视觉的手势识别系统在许多领域都有着其重要的应用:依靠电脑来帮助手语的教学,应用预先设定好的手的某些特定动作来实现对电视机的一些简单操控,许多在该方面的研究已趋于成熟的技术也用在电影制作、特技加工、3D动画、医学科研、游戏和娱乐等各个方面,还有一些设计开发只是处于概念阶段,比如奥迪公司今年展出的配备了手势识别系统的最新概念车。从这些年研究的发展上,可以看出将人与机器之间的互通交流变得更加简单直接无阻碍化是未来人机交互的一个重要的研究发展方向,也是当前科研界的一大热点研究课题。本文在计算机视觉系统这个基础上对人类的手势静态识别与动态跟踪原有的降维嵌入算法进行改进,得到一种新的非线性降维嵌入方法。由于手部变化姿势的出现,从一个单一的摄像头识别和跟踪人类的手势仍然是一个棘手的问题。在这里我们对现有算法做出一点改进,得到一个非监督学习算法——分布式局部线性嵌入算法(DLLE),去探寻诸如邻域关系信息这类数据的内在结构。在静态识别方面,首先捕获到的静态图像经过预处理后,再通过DLLE的嵌入算法使之嵌入在一个低维空间,并为静态手势的分类预设置一个数据库,数据库中存储的是预先采集好的样本组,之后使用概率神经网络(PNN)作为分类器,相似的输入图像就会被分类在一个组中;在动态跟踪方面,摄像头捕捉到手势的运动后,使用DLLE通过查找动作数据库找到其相应的位置,将被捕获的图像动态地映射到低维空间。根据PNN对其的分类,进一步计算其手势参数并重建模型。因为这些动态捕获的样本是作为一个手势运动过程序列存在于系统中,所以根据这些手势序列的邻域关系和在数据库中预先定义的关节参数模型,就可以计算重建关节参数。通过对使用新算法的手势识别结果的分析以及同LLE、NLE等方法在实际嵌入中结果的比较,证明所改进的新算法在静态识别与动态跟踪上均获得了显著的提高。