基于超像素分布与EMD度量的快速手势识别算法

来源 :湖南科技大学 | 被引量 : 0次 | 上传用户:wsadzjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势识别是指通过计算机设备对手势进行精确解释,实现人与计算机的交互。手势作为一种自然直观的人类交流方式,将其运用到人机交互具有重要的理论意义和应用价值。手势识别的研究历程大致可以分为三个阶段,依次是基于数据手套手势识别,基于视觉手势识别以及基于深度手势识别。随着微软Kinect深度传感器的推出,学术界涌现了大量基于Kinect深度传感器的手势识别论文。本文在大量阅读相关论文的基础上,提出了一个利用Kinect传感器基于超像素分布和EMD(Earth Mover’s Distance)度量的快速手势识别算法FSP-EMD。该算法充分利用了Kinect传感器提供的彩色图像、深度数据及骨骼点信息,大大提高了手势识别的效率和准确性。该算法的主要内容是:1)快速准确地检测手势。为加快手势检测,利用Kinect传感器的稳定骨骼追踪功能定位手势。将手势分割划分为手势定位与手势分割两个阶段。此外,本文提出一种新颖的深度区间包围手势的方法来分割手势,该方法快速且准确。2)提取紧凑丰富的手势特征。本文是基于超像素的手势识别,以超像素分布描述和概括手势特征。本文采用快速的SLIC算法生成超像素,并以六元组形式表示超像素,达到快速提取结构紧凑、内容丰富手势特征的目的。3)提出快速计算EMD距离子算法FC-EMD。本文采用EMD距离度量超像素分布间的距离,以EMD距离大小衡量图像中手势之间的相似性。并提出了快速计算EMD距离的FC-EMD子算法。该算法使得EMD计算的时间复杂度从单纯形法的O(n3logn)下降到O(n2logn)。论文中详细介绍了FC-EMD算法步骤、伪代码及时间复杂度的分析证明。实验结果表明,本文提出的快速超像素手势识别算法FSP-EMD,在运行时间上优于经典算法F-EMD及SP-EMD。同时,在自建数据集上的手势识别平均准确度为98%。
其他文献
图像半调技术和逆半调技术是图像处理技术的一个边缘分支。将噪声植入连续图像,变为二值图像的过程称之为半调过程,其逆过程称为逆半调过程。查找表法是逆半调技术众多方法中
随着电子书阅读器市场的成熟,电子书阅读器的功能也越来越强大,拥有了像WIFI,3G这样的高速网络通讯工具,因此要求各种各样的网络应用程序,像浏览器,邮件客户端等基础网络应用
随着计算机科学与技术的发展,计算机被应用到各行各业。决策支持系统(DecisionSupport System,简称DSS)越来越被人们重视,决策支持系统的模型系统也同样受到人们越来越多的重视
随着服务计算与云计算的发展,互联网上发布的Web服务数量也在迅速增长,通过调用不同的Web服务来快速搭建有创意的Mashup应用,引起了服务开发者的广泛兴趣,而如何帮助用户快速
近年来,在企业级应用开发环境中,面向对象的开发方式已成为主流,而关系数据库是目前使用最广泛的数据库,因此,在开发过程中通常会采用面向对象技术和关系数据库相结合的方式
随着XML技术的广泛应用,如何提高XML解析器的性能是一个亟待解决的问题。XML解析模型直接影响XML解析器的性能,因此解决这个问题应从XML解析模型入手。当前的研究工作大多基
随着Internet全面迅速的发展,网络已经渗透至各个领域,成为人们生活工作不可或缺的一部分。一方面,网络提供了海量的图片、文字、音频及视频等丰富的信息,使人们能够有机会从
认知诊断的目的是将被试在测验上可观察的反应模式划归到某一类认知结构或知识状态,从而达到诊断的目的,从本质上讲,认知诊断是一种模式识别。认知诊断在实施过程中可能会遇
近年来,随着多媒体技术和网络技术的迅猛发展,与嵌入式网络视频相关的应用越来越多。在这些应用中,为了实现视频信号的编解码,一般采用专门的H.264的编解码芯片或者使用DSP来完成
无线传感器网络是由传感器技术、无线通信技术、微机电系统技术和分布式信息处理技术结合而成的新型信息采集处理方式。它能够通过各类集成化的微型传感器协作,实时监测、感