论文部分内容阅读
手势识别是自然人机交互的一项关键技术,相对于传统的鼠标、键盘等机械设备,手势具有自然直观、容易理解等优点,更加符合人类日常交流习惯。Kinect是微软公司发布的一款可同时获取RGB彩色图像和深度图像的设备,它能从单帧深度图像中预测20个人体骨架节点的三维坐标,是研究基于计算机视觉的手势识别技术的理想设备。按照识别对象分类,手势识别可以分为静态手势识别和动态手势识别。本文以Kinect为输入设备,分别对静态手势识别技术和动态手势识别技术进行了研究。静态手势识别对单帧图像中手的形状进行分类,一般包括手势分割、特征提取、分类识别三个步骤,本文结合手部节点的位置信息和自适应阈值的肤色检测方法分割手势,提取Hu不变矩和手指个数作为特征,最后用SVM进行分类。动态手势识别对连续多帧图像中手的运动轨迹进行分类,一般包括手部分割、手部跟踪、特征提取、分类识别四个步骤,本文从单帧深度图像中得到骨架节点的位置,将骨架节点的运动轨迹作为动态手势的特征,使用距离加权动态时间规整算法计算训练样本和测试样本之间的距离,最后用K-NN进行分类。本文的主要研究内容包括以下三个方面:①提出一种新的静态手势分割方法:结合手部节点的位置信息和自适应阈值的肤色检测方法分割静态手势。该方法不需要大量训练样本,可以根据实时获取的图像动态调整肤色检测阈值。实验结果表明,该方法可以克服类肤色区域的干扰,具有很好的分割效果。②提出一种新的静态手势特征提取方法:在7个Hu不变矩的基础上加上手指个数构成一个8维的特征向量作为静态手势的特征。Hu矩和手指个数都具有旋转、平移、缩放不变性,手指个数可以直观的区分静态手势,但却不能唯一的表示静态手势。实验结果表明,在Hu不变矩的基础上加上手指个数这一特征后静态手势平均识别率有所提高。③提出一种新的动态手势分类识别方法:在动态时间规整(DTW)基础上提出一种新的距离加权DTW算法以计算动态手势测试样本与训练样本之间的距离,然后用K-NN分类器进行分类识别。由于每个骨架节点的DTW距离对最终分类结果的贡献不一样,所以对每个骨架节点的DTW距离赋予不同的权重。实验结果表明,改进后的算法具有更高的平均识别率。