论文部分内容阅读
手势交互作为一种新颖的人机交互手段,它简单、直观、易使用,在某些应用领域,如虚拟现实、手语翻译、远程控制等领域,有着不可替代的优越性,因此,越来越得到人们的重视。虽然目前还是一个研究热点,但是手势交互也已经渐渐开始应用于实际生活了,在最新研发的消费类数码产品中可以看到它的身影。这代表了一种未来交互的新趋势,也预示着手势交互未来广阔的应用前景。
要实现手势交互,需要解决三个关键问题:手势的检测识别、手势形状匹配和手势指令检索。本文对这三个关键点进行了有益的探索和研究,提出了一种基于计算机视觉的手势识别、匹配和检索的方法,旨在从一个单目视频序列中识别出人手的位置和手势形状,并将其和定义好的手势模型用基于形状上下文的方法进行匹配,从而达到识别手势指令的目的。为了方便扩展和维护手势指令集,存储手势模型图像的特征参数以节省再次运算所消耗的时间,提高检索效率,本文还就如何使用数据库技术对手势指令集进行存储、管理和检索提出了解决方案。
本文完成的研究工作及主要贡献包括以下几个方面:
1)总结了以前各种手势模型的特点,并结合形状上下文方法的特点,提出了一种新的手势模型的定义。该模型的特点是利用形状上下文方法将标准手形图像转换为对数极坐标直方图,用其作为手势模型的重要属性参数。
2)将肤色检测和差分运动分析相结合,从视频序列中分割人手区域,取得了良好的效果。相对于以往的方法,该方法克服了采用单一方法的局限性,具有较强的适用性和稳定性。
3)将形状上下文匹配方法运用于人的手势匹配。相对于以前的手势交互研究所使用的形状匹配方法,形状上下文方法利用了对数极坐标变换的二维不变性,使形状匹配算法具有二维不变性,克服了传统形状匹配算法的缺点,实验证明,非常适用于人的手势形状匹配。
4)对基于内容的图像检索技术进行了研究,并结合本文提出的手势模型,对手势信息进行数据结构建模,并且利用数据库技术来创建、存储和管理手势指令集。这样,通过应用程序可以方便地对其中的手势指令进行维护和查询。
本文围绕着如何将手势识别技术应用于实际环境这个核心目标进行了有益地探讨。本文提出的这种基于计算机视觉的手势识别匹配检索的方法是一种有效实用的方法,它主要运用形状上下文方法,不仅在手势的形状匹配上取得了良好的效果,而且也为手势建模和检索提供了新的解决途径。