论文部分内容阅读
手势识别是近些年来比较热门的一项人机交互技术,它属于机器学习范畴。作为一项对用户限制较小的人机交互技术,世界各地的研究人员们正在进行着将手势识别技术用于各个领域的研究工作,如手语识别、机器人手势控制等。
依托计算机硬件技术的发展,手势识别技术所采用的设备也在更新换代。起初,研究人员们将许多传感器件放入一副手套之中,要求用户在手势识别时带上这副手套,以直接接触的方式获取用户手势的信息,再进行识别。后来,人们意识到这种接触式方法对用户仍有很大的限制,并且费用昂贵。计算机视觉技术一经问世,便得到了迅速的发展。由于计算机视觉技术低价、低限制的特性,研究人员们便将其引入到了手势识别技术中,使用的设备换成了摄像机。
事物都具有两面性,基于视觉的手势识别不仅有优点,也有缺点:摄像效果易受环境影响,导致手势提取不准确;特征选取较难,导致对手势的描述不易被计算机理解等。这些缺点都直接或间接地影响了识别的准确率。经过研究人员多年努力,许多方法被提出来用于基于计算机视觉的手势识别中。大部分方法仍然具有一定的限制,识别的准确率也有待提高。
基于视觉的手势识别包含肤色分割、手势区域提取、手势特征提取、分类决策四个连续的过程。前一过程的输出即为后一过程的输入,因此,每个过程处理的效果都将对识别准确率造成影响。在实际应用中,通常要求识别具有实时性,还要根据应用的特点设计合理的方法,才能够得到准确的结果。
本文以现代跑步机为手势识别应用的载体,结合跑步机应用的特点,主要研究基于视觉的实时手势识别各个过程的方法及其实现。初始阶段采用阈值分割方法从运动视频中提取出手势关键帧。为了能够适应环境的变化,提出了平均光照肤色分割方法,将处理结果二值化。为准确找出手势区域,提出了基于窗口增长的手势区域提取方法。根据跑步机应用中手势容易晃动的特点,研究多种具有旋转、平移、缩放不变性的特征提取方法,提出了Hu矩与NMI的组合特征提取方法和HOG特征提取方法。使用SVM分类器,设计了OVO-SVMs用于多值问题的分类决策。
最后,在Linux平台下使用多线程与SDL消息机制实现了实时静态手势识别,并将识别结果以系统消息形式异步通知跑步机系统,实现跑步机控制目的。