基于CVAE-CGAN模型的3D手势估计方法研究

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:cscec83
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势估计是计算机图形领域与人机交互领域中重要的研究方向。随着计算机计算速度的突飞猛进以及其硬件成本的降低,基于深度学习的手势估计也得到了跨越式的发展。手势估计在自动驾驶、虚拟现实(AR)、增强现实(VR)、智能家居等诸多实际场景中具有广泛的应用。因此,手势估计已成为人类社会智能化发展的重要研究领域。然而,由于手部姿态变化丰富、手势识别背景复杂等原因,当前的手势估计在识别准确度、识别实时性等方面仍然存在诸多问题。首先,本文对手势估计中手部分割的已有方法进行了分析和研究。通过研究发现,提高手部分割的准确性有助于提升手势估计的效果,而传统基于语义分割的手部分割方法对于细节的刻画不足,因此,本文提出了基于融合结构FCRN网络的手部分割方法。首先,通过NIN模型将手势数据集中的RGB图像进行处理得到对应的皮肤检测图像;然后,将手势数据集中的RGB图像与通过NIN模型得到的皮肤检测图输入到具有Atrous空间金字塔池的全卷积残差网络FCRN网络进行深度融合训练,其中Atrous空间金字塔池用来优化模型的特征提取;最后,通过实验验证得出本文提出的方法优于传统的手部分割方法。其次,本文对手势估计中的三维关节点检测方法进行了研究与分析。通过分析变分自动编码器(VAE)的原理,以及跨模态方法在手势估计中的可行性,提出了基于CVAE-CGAN模型的跨模态手势估计方法。该方法将分割后的手部信息加入到VAE模型的训练中,使模型训练的输入信息更加丰富,此时,VAE模型转变为CVAE模型;然后,在CVAE的隐藏空间中添加了对齐网络CGAN,该方法将RGB图像模态的隐藏空间映射到3D手势模态的隐藏空间,比已有的跨模态共享隐藏空间的方法更加准确;最后,通过实验得出,本文提出的基于CVAE-CGAN模型的跨模态手势估计方法要优于已有的通过RGB图像估计3D手势的方法。
其他文献
随着我国社会经济水平的不断增长,建筑工程也在逐年增加。而工程建设企业也存在着很多财务风险因素,主要是由于工程施工存在着很多不确定因素和不同问题,工程项目又和公共设
我国从2006年起正式突破了股票期权的制度障碍。然而,两年多的实践显示,中国资本市场的弱有效性、内部人控制、公司业绩考核体系的不健全使得股票期权的激励效果大打折扣。鉴于
将双层叠合梁之间的接触状况拟合为一符合Goodman假设的弹性夹层,导出了Winkler弹性地基上双层叠合梁的微分方程组及其解析解。通过引入“广义夹层反应模量”计入了夹层水平和竖向反力引起的
唐时的中国,世界闻名。首都长安城是丝绸之路的起点,也是唐与西域各国进行文化交流、商业贸易的第一大城市。西域一百多个国家和唐朝有着密切的往来,西域各国使者、学者、艺
随着教育的不断改革,对学生的教育也不仅是倾向于成绩的培养,而是注重学生的综合素质的发展。在小学低年级的语文教学中,采用写话教学的方式,可以不断提升小学生的学习兴趣和
举世瞩目的“一带一路”倡议的提出和建设,为我国对外经济合作交流插上了腾飞的翅膀。同样也为我国旅游市场,带来了前所未有的机遇。我国是茶的故乡,茶叶历史发展悠久,茶文化博大
为进一步分析东北林业大学帽儿山实验林场溪流水生昆虫与环境因子的相关性,于2011年5月、7月、10月、11月,4次野外定点调查,共采集水生昆虫2 962只,隶属于5目、32科、97属、1
随着金融危机向实体经济扩散,铜、铅、锌价格大幅下跌,而且存在进一步下跌趋势,企业纷纷减产、裁员以应对,行业无疑跌入低谷。2009年,铜、铅、锌行业必须面对市场萎缩、资金
目的探讨中药雾化透皮治疗疗法对痉孪型脑性瘫痪患儿粗大运动功能康复疗效的影响。方法将80例痉挛型脑性瘫痪患儿随机分为2组,观察组40例给予中药雾化透皮治疗疗法治疗配合推
作为土地征收与房屋拆迁法定原因之一的"公共利益",因其内涵模糊不清、界定主体异化,往往成为达到征收与拆迁目的的"法器"。界定公共利益,应首先设定界定标准,同时构建公共利益的