基于深度图的手势识别研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:shangdianxitongguanl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势识别在许多领域扮演着越来越重要的角色,如手语识别,视频游戏,虚拟控制。传统基于数据手套和彩色图像的识别方法各自有其局限的地方。数据手套要求大量的校准,并且限制手的自然运动,而且是很昂贵的。彩色图像难于分割手部,特别是当场景中出现重叠、光线变化、快速移动和与皮肤颜色相近的物体时,会更加困难。Kincet等深度摄像头的推出为手势识别提供新的途径。在深度图中,像素点的值表示主体对应点到摄像头的距离。深度图易于将手部分割出来,同时还提供2.5D几何信息。深度摄像头不受光照影响,甚至可以在黑暗的环境中工作。我们设计了基于深度图的静态手势识别和动态手势识别算法,并利用深度学习框架研究了深度图手部的底层特征,将学到的特征用于静态手势识别。对静态手势识别,我们设计基于手部主方向的识别算法。该算法对尺度和旋转不变。我们提出手部主方向的概念和计算方法,手部主方向能保证手部的旋转不变性。我们的算法处理一帧需要0.13秒,能够实时处理Kinect产生的图片。我们在两个公共数据集NTU和sASL上测试我们的算法,分别达到了97.1%和96.2%的识别率。对动态手势识别,我们设计了基于UV特征和随机森林的识别方法。我们的算法巧妙避免了视频序列对齐和压缩的问题。在每个动作种类的训练只有一个的情况下(所谓one-shot learning),该算法在ChaLearn数据集的识别率达到85%。手动设计特征通常比较困难,深度学习(deep learning)框架可以自动学习特征。我们利用深度学习在手部深度图学习特征,用softmax分类器分类。在NTU数据集上,该方法获得93%的识别率。
其他文献
80年代中期以来,随着信息技术的飞速发展和计算机的普及应用,特别是通信质量的不断提高,通信手段的多元化,以及近几年Internet的飞速发展,为信息的交流尤其是多媒体信息的广泛传播
该论文的研究重点主要包括神经网络智能PID控制器和下位机基于嵌入式操作系统的控制程序的设计与实现.从提高整个系统的适应性、可操作性和鲁棒性出发,提出以下解决方案:利用
该文提出了要将排课规则和排课算法分离的排课系统结构,同时将智能规划的思想和技术应用在排课算法,使用图规划的方法改进了排课算法,使排课算法搜索次数减少,回溯条件增强,
该文首先从宏观角度阐述了访问控制的基本理论;进而对自主访问控制、强制访问控制、基于角色的访问控制这三种安全机制的安全模型和实现机制进行了详细的分析讨论;并结合美国
该论文研究的主题是公安科技管理信息系统的设计与实现.文章对管理信息系统(MIS)的概念、开发方法、技术特点、结构作了详细论述,并在分析MIS关键技术的基础上,针对公安科技
该文首先对WAP体系结构、层次结构加以说明和分析,指出其应用框架存在的问题,再通过对目前典型应用框架(B/S、C/S、三层、多层)现状的进行了综合分析和比较,结合WAP自身的特
随着信息产业的不断发展,信息数据正在呈爆炸性地增长。如何从这些海量的文本数据中挖掘出我们所关心的信息,已成为重要的研究课题。数据挖掘的主要作用是实现对数据的自动分析
相似性分析是计算机视觉及模式识别的一个重要领域,虽然形状匹配和它有相同的含意,但是相似性分析比形状匹配更具有一般意义.相似性分析研究的对象不是局限于特定形状的图像,
随着软件规模的扩大和软件应用领域的延伸,软件设计的可重用性成为一个重要的课题.通用程序设计通过对算法和数据结构的抽象与系统化组织,两者分离设计,再通过中间媒介迭代器
该文对气象资料的实时及高效率压缩做了详细的研究和介绍,并完成了系统软件的设计.主要内容包括:(1)在研究了各种流行的数据压缩技术的优缺点之后,设计了针对气象资料进行实