基于祼手的自然人机交互关键算法研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:fakejay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于计算机视觉的人机交互是自然人机交互技术领域的研究热点,它利用视觉信息从视频序列中捕获并理解人的肢体动作,使人与计算机之间的交互摆脱了鼠标及键盘的约束,人只需要通过肢体动作、手势、表情等自然信息就能与计算机进行交流,突破了从计算机诞生至今在人机交互过程中必须由人来适应机器的屏障,人与计算机之间的交流更加自然、流畅。人手在信息交互过程中蕴含大量信息,因此在人机交互系统中处于非常重要的地位。文献[30]指出,手指交互技术主要有四类应用:手语识别、手势识别、手指书写、虚拟触控,如何获得手指状态信息是其中的关键点。通过附着在手上的特殊设备如:数据手套或传感器可以准确的获得手部3D模型从而获得手部运动和形状的准确信息,然而却要求附加额外的设备,价格昂贵,不易普及应用。随着图像处理、机器视觉、人工智能等学科的不断发展,基于普通摄像头,并以一种机器视觉的方式获得手指状态信息成为可能。这是一种更加自然同时也更加廉价的人机交互方式。然而,由于人手是一种多关节非刚性物体,手指的状态在运动过程中不断发生变化(可高达27个自由度[22])以及视觉本身的不适定性,使得基于视觉的手指交互是一项极具挑战性的研究。国内外众多学者及相关研究机构在基于视觉的人机交互系统的研究上做出了大量富有成效的研究,然而,由于多数研究对应用环境都做出了苛刻的限制,与真实应用环境出入较大,难以适应真实的应用环境。针对此问题,本文分别提出复杂环境中手势分割算法、实时指尖定位算法和基于Mean Shift及粒子滤波的手部运动跟踪算法,并在以上算法的基础上设计并实现了基于视觉的人机交互系统。具体而言,本文贡献如下:   1)复杂环境中的手势分割方面。针对复杂环境下,肤色识别效果较差的问题,本文提出了基于颜色及局部背景差分法的肤色检测算法。该算法首先在YCbCr颜色空间中检测背景中的类肤色区域,并通过基于码本(codebook)的背景建模方法对背景中的类肤色区域进行建模。然后应用亮度无关的静态椭圆肤色模型在YCbCr颜色空间中的CbCr平面上对肤色进行初次检测,如果初次检测结果与背景中的类肤色区域存在重叠部分,则在重叠部分应用局部背景差分法分割出准确的前景肤色区域。该算法能够在复杂环境中准确分割出肤色与非肤色,据有极强的适应能力及较高的执行效率。   2)手指指尖定位方面。针对3D手部模型在基于视觉的人机交互系统中过于复杂难以进行实时计算的问题,本文提出了一种简化的手部2D模型,与以往的手部2D模型相比较,该模型的特点是强调手掌重心位置及手指指尖位置,根据该模型只要准确找到手掌重心就能根据指尖与手掌重心的距离关系定位指尖位置。其次,提出了基于距离变换的手掌重心查找算法,该算法能够稳定准确的定位手掌重心,并且查找到的重心位置与手指伸出的数量及状态无关。最后,本文提出了基于距离变换的手指指尖定位算法,本算法能够准确的查找到指尖位置,且运行效率较高,完全满足实时计算任务要求。   3)手部运动跟踪方面。对目标进行快速准确的跟踪一直是基于视觉的人机交互系统的研究重点,针对人手的无规则快速运动难以进行有效跟踪的问题,本文提出了基于MeanShift及粒子滤波的四向预测跟踪算法,该算法结合了MeanShift算法及粒子滤波算法各自的优点,当目标发生突然变向运动而导致运动目标跟踪丢失的前景下将启动四向预测机制,对运动目标实施二次预测搜索,该算法能对快速变向运动目标进行有效跟踪,完全满足手部不规则变向运动的实时跟踪要求。   4)手部跟踪目标区域初始化方面。在基于区域的跟踪方法中,被跟踪区域的初始化过程通常是人手工标记完成的,如何自动初始化被跟踪目标区域一直是一个研究难点,本文提出了一种基于手部特征的跟踪区域自动识别算法,该算法能够有效利用肤色检测及手指指尖查找的结果,与本文提出的指尖查找算法及快速目标跟踪算法据有良好的集成性。   5)实时手部运动跟踪及指尖定位方面。由于基于视觉的人机交互系统是一个涉及到计算机图形学、模式识别、人工智能等众多学科领域的复杂系统,因此,如何将处理不同问题的算法进行有效集成,使其成为一个有机的统一体,是任何一个人机交互系统的设计者所必须面对的重要问题。本文对复杂环境肤色检测算法、基于码本的背景建模方法、指尖定位算法及四向预测跟踪算法进行了有效集成,充分考虑了各个算法计算结果的复用性,保证了系统整体的运行效率,形成了基于手部运动及指尖定位的人机交互系统的基础,实验证明该系统能够有效应用于基于计算机视觉的人机交互环境。
其他文献
能源的开发与利用为推动人类的文明进步起到了至关重要的作用。如今,能源的开发与利用在世界范围内还将持续增长,中国及山东省的能源消费也在逐年增加。但是,能源的开发利用具有
本文的目的是讨论一类在各种科学领域广泛存在的系统,即三维缓变系统,由于该类系统在神经生物学方面的重要地位,故其动力学性质尤显重要.文中,我们介绍了一种讨论该系统的动
多约束非线性背包问题是一类特殊而重要的整数规划问题,它可以定义为在有限整数集上极大化一个可分离非线性函数的多约束(可分离)最优化问题。由于这类问题在资源分配,工业生产
计算机仿真技术是以多种学科和理论为基础,以计算机及其软件为工具,对系统进行实验研究的理论和方法体系,仿真技术在解决科学研究、系统设计、生产控制和教学训练等方面所发
为了满足工农业生产和人民生活的需要,解决水资源时空分布不均的问题,我国兴建了许多大型泵站。江苏省内的一些泵站,由于受潮位的影响,扬程变化频繁,变化幅度较大,实现这些泵站的节
输入串联输出并联(Input-series output-parallel,ISOP)逆变器组合系统适用于高压直流输入和大电流交流输出的应用场合,其多模块串并联组合系统的特点令其可有效提高电源系统工作的可靠性,而切实体现这一优点的关键就是要实现其冗余容错运行;此外,使用多个小容量逆变器模块以ISOP拓扑组合成中大容量的并网逆变器应用于新能源发电系统中,则可以使得系统容量易于扩展、降低系统开发设计难
本文通过对荣华二采区10
目前养蜂人常用蜂群自然分蜂、人工远距离转移蜂群分蜂两种方法,这两种分蜂方法比较简单,可操作性强,但存在可控性差、跑蜂风险大、管理成本高等不利因素,在一定程度上制约了
期刊
本文首先对永磁直线无刷直流电动机的基本工作原理和结构特点进行了详细的分析和介绍,并在此基础上建立了电机的数学模型。结合永磁直线无刷直流电动机的数学模型,建立了具有位置环、速度环和电流环的永磁直线无刷直流电动机位置控制系统。其次,电机在工作过程中省略了如滑轮、丝杠等中间转换装置,导致扰动直接加在直线电机的初级上,控制系统的抗扰动能力明显变差。针对这一问题对电机的扰动力构成进行了分析,发现扰动主要来自
微阵列技术是现代生命科学领域中一项具有革命性意义的重大技术,对疾病的诊断和治疗、基因功能的研究都将产生深远的影响.通过微阵列技术,研究人员可以同时监测成千上万个基