论文部分内容阅读
基于计算机视觉的手势识别技术是人机交互领域一个重要研究方向。随着3D体感技术的快速发展,利用人体手势作为计算机的直接输入,在自然交互界面下,实现对操作设备的短程控制是手势识别技术应用于人机交互系统的主要方式。本文基于Kinect的手势识别及跟踪方法研究主要包含四个方面的内容,手势跟踪、手势图像分割、手势特征的提取以及手势识别算法,主要研究工作包括:(1)研究基于深度信息的手势追踪方法。选用Kinect2.0作为深度数据的输入设备,借助骨骼追踪技术,获取人体骨骼关节的空间位置信息。在手势图像分割部分,研究了基于深度直方图的阈值分割算法,针对原始深度直方图存在噪声干扰缺陷,将图像深度值与邻域深度值相融合,并绘制基于深度值-邻域深度值的二维深度直方图。依据直方图统计结果,采用Otsu阈值分割算法进行手势图像分割,获取手势目标区域。(2)提出了融合Hu矩与边缘长度矩的DAG-SVMs的静态手势识别算法。首先采用Sobel算子检测手势图像的边缘轮廓,然后融合边缘特性Hu矩与边缘长度矩作为静态手势新特征。选用多类支持向量机算法(DAG-SVMs)进行识别,通过优化分类器的随机结构来提高算法的识别率。仿真实验结果表明,结合边缘长度矩与Hu矩作为新的图像特征的DAG-SVMs的静态手势识别算法识别率达到了 97.69%,与单一的Hu矩作为图像识别特征的支持向量机算法相比,识别率提高了 1.78%。本文设计了一种利用手势控制多媒体音量的交互系统,将静态手势识别结果转化为多媒体软件音量的控制级,交互系统能够执行5种静态手势的控制指令。(3)研究了基于动态时间规整(DTW)算法的动态手势识别算法。通过提取6种常用动态手势在时间序列下的几何参数特征与图像四元数特征,构造了动态手势特征模板。利用DTW算法寻找测试样本与参考模板之间的最优的匹配路径,将动态手势进行分类。仿真实验结果表明,本文提出的动态识别算法能够有效识别6种常用动态手势,识别准确率达到了 94.73%。且验证了在不同照度的背景环境下,采用基于DTW的动态手势识别算法,识别结果也不会受到影响。