视觉人机交互中的人手姿态估计研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：xbmkdx

【摘要】

：

基于视觉的人机交互方式具有对于用户无干扰、不需要穿戴传感器、交互自然等优点，在新一代人机交互系统中有着重要的应用价值。肢体动作作为人最基本交互方式之一，自然、快捷、

【作者】

：

杨硕

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2017年期

【关键词】

：

视觉人机交互人手姿态估计卷积神经网络数据集扩充

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

基于视觉的人机交互方式具有对于用户无干扰、不需要穿戴传感器、交互自然等优点，在新一代人机交互系统中有着重要的应用价值。肢体动作作为人最基本交互方式之一，自然、快捷、方便且传递的信息量丰富，而人手作为最高效、最灵活的肢体部位，其功能最强大，使用最广泛，在视觉人机交互中占有举足轻重的地位。精确的人手姿态估计能够直接用来进行人手建模、人手动作理解等。本文以建立快速准确的人手姿态估计系统为目标，研究基于三维卷积神经网络的人手姿态估计算法，主要包括:　　1.提出了一种基于三维卷积神经网络的人手姿态估计算法，能够实时准确地预测输入深度图像中人手的三维位置。本文将输入深度图像转换为三维的的Truncated Signed Distance Function(TSDF)表达，不仅能够表达出人手表面在空间中的位置，同样也对空间点到人手表面的距离进行编码，是深度图像人手区域较好的三维表达。已有的基于卷积神经网络的人手姿态估计工作多以深度图像作为输入，预测人手关节点的三维位置，这类工作要求算法能够自主地学习深度图像到三维关节位置的映射或者需要后续优化处理，这些方法往往造成较大的误差。针对这个问题，本文首次使用三维卷积神经网络估计人手关节点位置。我们的方法以三维TSDF为输入，从三维层面提取特征，避免了不必要的误差，并且由于三维特征较好地蕴含了三维上下文信息，可缓解了人手自遮挡问题，使得算法能够达到更高的精度。此外，由于深度相机拍摄图像精度低、噪声大和边缘深度缺失等问题，因此对原始深度图像进行去噪和填充缺失是提高人手姿态估计精度必不可少的关键环节。鉴于此，本文提出一种基于三维全卷积网络(Fully Convolutional Network，简称FCN)的深度图像TSDF表达超分辨率网络。该网络从大量样本中学习数据规律，对输入的数据进行超分辨率优化，达到了去噪和填充缺失的目的，更好的数据质量进一步提高了人手姿态估计的精度。本文算法运行速度基本能够达到实时系统的要求，约为30FPS(Frames Per Second)，且在NYU人手数据集上预测误差约为17.6mm，为目前最好的精度，且已经达到人类标注数据的准确性范围(约20mm)。　　2.提出了一种扩充人手数据集的方法，能够将现有的人手手势转移到不同的人手上，使得数据集能够覆盖更多的人手配置。基于深度学习的人手姿态估计迫切需要大量的多样化人手深度图-姿态数据集，然而现有的数据集或者没有较全面的人手手势或者从单一个体采集数据，使得人手数据集不能够反映现实情况，这严重影响着据此得到的人手姿态估计算法的准确性和鲁棒性。本文提出一种数据集扩充方法，能够将现有的人手手势转移到不同的人手配置（胖瘦，大小等）上，使得人手数据集多样性、完备性更好。该方法的基本流程是:首先从现有数据集中提取出较多的人手手势，将其编码为骨骼长度无关的局部坐标系角度，然后结合不同尺寸的人手，并进行蒙皮(mesh)和渲染，最终可得到大量的手势一致、大小胖瘦不同的人手数据。实验表明，基于我们方法扩充后的人手数据集明显地提升了人手姿态估计算法的精度。

其他文献

基于兴趣度驱动OLAP的决策支持系统模型

计算机的应用领域从上世纪60年代前后由单纯的科学数值计算扩展到了管理领域,以文件系统为基础的数据收集、加工处理程序出现;70年代出现了数据库管理系统(DBMS),从此管理信

学位

决策支持OLAP数据立方体格多维数据分析数据兴趣度DIDOM模型ADOMDMDX.NET Framework

支持协同感知的人-人交互界面自适应机制研究

经济的全球化和社会的信息化，特别是网络技术的迅猛发展，使得人们面临着更为广泛的活动范围和更多的合作机会，群体的规模越来越大，范围也越来越广。在教育领域，人们将目光也由个别

学位

人-人交互自适应机制协同感知

Android系统漏洞的动态检测与静态检测关键技术研究

当今我们生活在移动数字时代，廉价、快速、小巧的手机已经成为人们在生活和工作中的必需品。互联网分析公司Statcounter在2017年3月的一份统计结果显示，截止目前，在全球所有的上

学位

安卓系统漏洞挖掘动态检测源代码静态检测污点传播

移动IPv6快速切换机制的研究与实现

随着Internet技术和下一代移动通信技术的发展,各种无线接入技术层出不穷,IP网络逐渐成为基础网络,基于无线接入的IP业务应用需求也不断增长.与此同时,笔记本电脑、移动电话

学位

IPv6移动IPv6切换切换延时快速切换转交地址绑定更新双向隧道WLANL2 TriggersLinuxNetfilter

中间件软件工程研究

中间件位于网络操作系统和应用组件之间，用它可以简化构筑大规模的分布式系统。中间件解决了系统异构、设施通信和分布式组件的协调等问题。利用现有的中间件产品，软件工程师能

学位

middlewaremeta-objectmeta-protocolcomponent Qos体系结构基础设施绑定软件工程分布式计算

HT-7U等离子体位形实时反馈控制系统

中科院等离子体物理研究所正在兴建的HT-7U是世界上最大的超导托卡马克装置之一,它的目标是实现长脉冲稳态运行,要实现这个目标,必须科学、合理的设计和实现HT-7U的控制及数

学位

HT-7U超导托卡马克控制及数据采集系统等离子体位形实时反馈控制系统EFIT

基于图计算的人机协同信贷风险分析系统设计与实现

随着我国互联网和经济的高速发展，社会在不断发展进步，大数据时代的到来使得数据正以爆炸式的速度增长，同时互联网也促进了信息的高速传播，传统行业受到了“互联网+”的冲击，开始

学位

信贷业务风险评估数据库图计算可视分析

基于XML的网络课件标准体系及浏览处理研究

随着信息网络技术的飞速发展，网络教学在教育领域发挥越来越重要的作用，并日益深刻地影响着教学内容、教学方法、教学模式的变革。网络教学需要大批高质量的教学课件。目前许多

学位

远程教育XML网络课件标准体系页面课件浏览器

基于三层B/S模式的Web数据库管理信息系统的研究与应用

我们近年来进行了基于Web的三层B/S模式的数据库管理信息系统的研究与开发,实现了内蒙古大学教务管理信息系统,是自治区首家基于Web的高校管理信息系统.包括了教学管理、大学

学位

B/S模式Web数据库管理信息系统教学管理

XML及其在电子商务中的应用

电子商务是一种在互联网上利用互联网技术进行商务活动的形式。近年来，随着互联网技术的发展得以迅速地发展起来。目前，如何利用最新的互联网编程技术，生成高效可靠的电子商务方

学位

XMLHTMLASP.NETADO.NET电子商务

视觉人机交互中的人手姿态估计研究

与本文相关的学术论文