【摘 要】
:
进入信息化时代,人们对增强现实、虚拟现实等新兴人机交互技术和机器人技术的需求越来越多。作为这些技术的一环,手部姿态估计在其中起着重要的作用。近年来,随着商用深度传
论文部分内容阅读
进入信息化时代,人们对增强现实、虚拟现实等新兴人机交互技术和机器人技术的需求越来越多。作为这些技术的一环,手部姿态估计在其中起着重要的作用。近年来,随着商用深度传感器的普及和深度学习的成功,涌现出了大量基于视觉的手部姿态估计方法,用于从图像中估计出手部关键点的位置。尽管这些方法取得了令人欣喜的成果,但在所提供信息的精度与丰富程度上依然有待改善。因此,十分有必要对基于深度信息的手部形状与姿态估计方法展开研究。本文对基于深度信息的手部形状与姿态估计方法进行了深入的研究,并提出了两种方法,一种用于改善手部姿态估计精度,一种用于在估计手部姿态的同时提供手部形状信息。主要研究工作如下:(1)考虑到深度图不能充分利用手部空间信息且存在透视失真,而体素数据对内存资源占用较大,因此,本文采用点云作为数据表达形式。为了直接从点云数据中提取特征,本文设计了一种新的点云处理模块lapel,该模块可以关注到输入点云中的局部信息,同时也有较强的特征提取能力。基于lapel模块,本文搭建了用于手部姿态估计的网络lapel-Net。该网络通过编解码器提取特征,并估计点云相对于关键点的热图与单位向量场,进而恢复出关键点坐标。为了进一步改善估计网络的鲁棒性,本文提出了两种技巧,即可控旋转与采样-集成,前者用于训练阶段的数据扩充,后者用于测试阶段补偿降采样造成的信息损失。几个公开数据集上的实验结果表明,本文在性能上与当前最优方法相当,其中在ICVL上获得了最低误差,这验证了本文方法的有效性。(2)MANO模型是一种形状与姿态真实且可控的手部网格生成模型,但是目前尚无利用MANO模型从深度图中估计手部形状与姿态的相关研究。本文设计了一种基准网络,利用MANO模型从深度图中估计手部形状与姿态。同时在该基准网络基础上,提出了三种估计方案,探索不同监督方式对网络估计性能的影响。为了评价生成的手部形状质量并进行细致分析,本文依照真实数据分布,制作了一个合成数据集,包含深度图及其手部形状、姿态的准确标注。通过在合成数据集与真实数据集上的实验结果对上述三种方案进行分析比较,并总结各个方法的优缺点。实验表明,使用MANO模型从深度图中估计手部形状与姿态估计的方法可行,同时仍然存在一定的改进空间。
其他文献
如今,教育正变得越来越信息化。随着国家对学历教育的更加重视,对基础教育的学科建设要求越来越高,学科的教学任务也越来越重,相关的研究单位和人员正在对学科教学进行改革和
给定一张大的数据图和一张小的模式图,子图枚举的任务是找到数据图中所有与模式图同构的子图。子图枚举是许多复杂图分析应用的基础。分布式大规模子图枚举算法数据通信开销
本文在我国2020年第十四届全国冬季运动会举办前夕、北京2022冬奥会筹备关键期以及国家大力推行“北冰南展”战略和广东省开创体育强省建设新局面的大背景下开展,具有时代感与使命感。一系列推动举措让冰雪运动在全国范围内迎来了发展机遇。广东省作为我国改革开放前沿阵地,开展冰雪运动地推广将有利于完善冰雪运动的相关制度,丰富各级冰雪运动组织、社团结构的类型,达到扩大广东省冰雪运动人口数量,拓宽冰雪竞技人才选
当前很多的作者使用文学作品中的人物元素创作出新的作品对外传播,在互联网时代这种行为可能会造成原著作权人的利益受损。故本文意在从司法实践中的案例入手,分析使用他人文
测量仪器作为主要的数据信息来源,在社会发展过程中起到了至关重要的作用。如今,各种智能化和数字化的测量仪器更是层出不穷。与此同时,人们在采集和测量数据的时候,往往需要
随着工业4.0以及中国智能制造2025的快速推进,视觉测量方法的应用越来越广泛,视觉测量精度取决于摄像机的标定精度,传统视觉测量标定方法采用张氏标定法,该方法为离线标定无
分离定理是泛函分析和优化理论的基石.经典凸集分离定理在凸分析和凸优化理论中发挥着巨大的作用.对于非凸集情况,一些学者通过所涉及集合的法锥建立了各种“Fuzzy”分离定理,极点原理就是这样的“Fuzzy”分离定理,后来又建立了各种确切(“Exact”)分离定理.本文主要讨论Aspplund空间中有限多个不相交闭集关于Fre-chet法锥的确切分离定理.考虑到已有的确切分离结果要求紧性这一强的限制条件
程序规约在软件工程中具有重要作用,它是对程序性质的形式化描述,可以帮助程序分析工具理解复杂程序的语义。随着程序库在软件开发过程中的广泛使用,为程序库API生成程序规约
当今时代,随着身份识别方面的需求应用越来越多,如何准确快速的鉴定个人身份的同时,保护个人的信息安全,是当前必须解决的关键性问题之一。手背静脉识别技术,对身份信息的识
三维重建能够反映图像中完整的场景信息,在工业自动化、虚拟现实应用、视觉导航等领域应用广泛,因此三维重建技术逐渐成为新的研究热点和需求。目前基于立体视觉的三维重建存