论文部分内容阅读
随着虚拟现实技术的迅猛发展,研究符合人际交流习惯的新颖人机交互技术变得异常活跃,也取得了可喜的进步。这些研究包括人脸识别、表情解释、口形(唇读)识别、头部方位检测、视线跟踪、三维定位、手势识别与人体姿势识别等等。其中,手势识别是当前比较热门的研究课题。本文对基于视觉的静态手势识别技术进行了比较深入的研究,并对其中的部分关键算法进行了改进。整个研究过程分为四大部分,即手势图像的获取、手势图像的预处理、手势图像的特征提取和手势图像的识别。具体工作如下:1.手势图像的获取方面,本文使用WINDOWS操作系统自身携带的VFW(Video forWindows)API函数,通过其AVICAP模块中的消息、宏函数、结构以及回调函数实现实时视频帧的捕获,并把得到的视频帧存放到自定义的数据结构DIBINFO中。2.手势图像的预处理方面,本文首先使用灰度直方图算法将手势图像二值化,然后根据本文提出的一种复合型去噪算法对图像消噪,再后采用掏空内部点的方法对手势目标进行轮廓提取,最后采用八邻域扫描法对手势目标进行边界跟踪。3.手势图像的特征提取方面,本文首先研究了人手的常见特征,如人手的面积、人手的矩形轮廓面积、手指(除拇指外)个数等,然后根据神经网络的特点,提出了手势图像的网格特征提取方法。4.手势图像的识别方面,本文采用了二次分类法,即首先用人手的常见特征对手势图像进行粗分类,然后用BP神经网络算法进行细分类,神经网络的输入层输入的是手势图像的网格特征,隐含层采用Sigmoid函数,输出层为四个节点。在构建手势图像的标准手势库时,采用了十种常见的手势作为标准手势。实验结果表明,本文对手势图像的二值化和去噪有较好的效果,系统的识别率和识别精度也较高。但也存在一定的问题,比如说标准手势库还不够完善,系统在复杂背景下还没有得到很好的验证。所以本文研究的手势图像识别技术,在一定程度上是对现有技术的一种改进和补充,而算法的优劣和可靠性,还有待于后续工作的继续完善和验证。