论文部分内容阅读
手势识别是指通过计算机设备对手势进行精确解释,实现人与计算机的交互。手势作为一种自然直观的人类交流方式,将其运用到人机交互具有重要的理论意义和应用价值。手势识别的研究历程大致可以分为三个阶段,依次是基于数据手套手势识别,基于视觉手势识别以及基于深度手势识别。随着微软Kinect深度传感器的推出,学术界涌现了大量基于Kinect深度传感器的手势识别论文。本文在大量阅读相关论文的基础上,提出了一个利用Kinect传感器基于超像素分布和EMD(Earth Mover’s Distance)度量的快速手势识别算法FSP-EMD。该算法充分利用了Kinect传感器提供的彩色图像、深度数据及骨骼点信息,大大提高了手势识别的效率和准确性。该算法的主要内容是:1)快速准确地检测手势。为加快手势检测,利用Kinect传感器的稳定骨骼追踪功能定位手势。将手势分割划分为手势定位与手势分割两个阶段。此外,本文提出一种新颖的深度区间包围手势的方法来分割手势,该方法快速且准确。2)提取紧凑丰富的手势特征。本文是基于超像素的手势识别,以超像素分布描述和概括手势特征。本文采用快速的SLIC算法生成超像素,并以六元组形式表示超像素,达到快速提取结构紧凑、内容丰富手势特征的目的。3)提出快速计算EMD距离子算法FC-EMD。本文采用EMD距离度量超像素分布间的距离,以EMD距离大小衡量图像中手势之间的相似性。并提出了快速计算EMD距离的FC-EMD子算法。该算法使得EMD计算的时间复杂度从单纯形法的O(n3logn)下降到O(n2logn)。论文中详细介绍了FC-EMD算法步骤、伪代码及时间复杂度的分析证明。实验结果表明,本文提出的快速超像素手势识别算法FSP-EMD,在运行时间上优于经典算法F-EMD及SP-EMD。同时,在自建数据集上的手势识别平均准确度为98%。