论文部分内容阅读
手势识别是计算机“以人为中心”的产物,通过识别视频图像中人的手势,完成计算机中的一些特定的操作。与传统的输入设备(键盘、鼠标等)相比较,手势具有易操作、自然和友好等优点,使得手势识别成为了人机交互系统研究的一大热点。目前国内外的学者们都致力于这个领域的研究,也为人们的生活带来了许多的便捷,但是由于手势识别系统的复杂性,这个领域仍然有许多需要攻克的难关。本文针对基于视觉的手势识别模型,建立了两个不同的系统:基于SVM的手势识别系统和基于深度学习的手势识别系统,围绕这两个系统,并且分别针对不同的情况,对两个系统的实验结果进行了相应的比较和分析。本文围绕手势识别系统,所做的主要工作如下:(1)通过对输入视频图像进行去噪、图像光平衡、图像分割、图像二值化和图像轮廓提取等数字图像处理操作,实现了对手势的精确分割,为后续手势图像的处理打下了良好的基础。(2)提出了将帧间差分与肤色信息相结合的手势检测方案,能够实时且准确的定位手势的初始位置,然后利用Camshift算法对手进行实时的跟踪,减少计算量的同时,减少了周围环境因素的干扰,整体提高了系统效率。(3)构建了基于SVM的手势识别系统,在此系统中,用Hu不变矩、傅里叶描述子和手势空间区域特征组成了一个20维的向量作为手势特征,得到了较高的识别率。同时,为了与基于深度学习的手势识别系统进行对比,在SVM系统中,还测试了只有Hu不变矩为特征时的手势识别率。(4)将深度学习应用到手势识别当中,构建了基于深度学习的手势识别系统,该系统还运用了两种不同的模式,一种是直接输入二值化的图像进行训练、分类,另一种是提取手势的Hu不变矩特征,将深度学习作为分类器使用。将这两种模式得到的分类结果分别与SVM的结果进行了比较。