基于深度学习的人体姿态估计技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:g471151931
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近几年计算机软硬件技术的蓬勃发展,各种人机交互游戏与应用被广泛普及。人体姿势估计是众多人机交互任务的基础,它通过准确估计图像或视频信息中人体各个关节点的坐标,完成对人物的动作识别和行为分析,从而为人机交互设备提供下一步的操作数据,因此它是人机交互系统必不可少的重要部分。人体姿态估计算法可以分为传统的基于图模型的方法和现阶段的基于深度学习的方法。传统的基于图模型的方法将人体视为一系列具有强相关性的部件,使用图像结构模型来模拟人体每个组件的外观模型和组件与组件之间的空间约束,并利用图形推理的方法来最后优化一下人体各个关节的位置。这类方法的算法准确度和算法复杂度成正比,子模型空间越大,能模拟的人体姿态越多,算法的计算量和复杂度就越高。与传统方法相比,基于深度学习的方法不需要模型先验知识,却能取得更好的效果。所以本论文基于深度学习实现了两个人体姿态估计网络,主要的贡献如下所示:(1)实现的基于FPN的two-stage R-FPN网络将残差模块和转置卷积应用于特征金字塔网络得到的多尺度融合的特征之上,它们在网络层数很深和上采样倍数很大的情况下仍然能取得不错的效果,之后通过多阶段的网络设计和多处中继监督点的设置,将多处预测的热力图和基于数据标注用2D高斯函数构建的热力图做L2损失计算,从而优化网络参数。以上措施的应用解决了原始特征金字塔网络对被遮挡的关节点定位不准的问题。(2)实现的Densely-hourglass Network通过巧妙的设计使经典网络Stacked hourglass network中的沙漏模块能像DenseNet网络一样进行相同通道数相同分辨率大小的特征图的紧密连接,从而达到在网络使用比较少参数的情况下都能实现很好的效果,之后通过网络中部分concatenate和BN操作的优化显存使用量的策略,达到了压缩显存使用量的目的,从而让我们能在有限的硬件条件下,训练出更深的网络。
其他文献
本论文从城市道路网容量和道路利用效率的角度,阐述了大城市的交通结构。主要内容有:城市交通体系中公共交通与个体交通之间的比例关系以及公共交通系统内部的各要素之间的比例
对元江县城生活垃圾处理现状和存在问题进行了调查分析,提出了相应的治理对策措施。
结合人工神经网络对噪声数据具有高承受能力,且对未经训练的数据具有分类模拟能力的特点,讨论了在数据挖掘领域中利用BP网络进行数据分类的实现过程,描述并分析了BP算法.然后
为解决空中交通拥塞,保证航空器在自由飞行环境下的飞行安全,综合考虑高空风、CNS性能和机载防撞系统等3种飞行环境因素,建立了基于概率的碰撞风险模型。根据给定安全目标水平,利
如何让宝宝高高兴兴地入园、坦然面对幼儿园的生活,已成为了年轻父母最为关心的问题。做好幼儿入园前的准备,就是解决这一问题的有效途径。从家庭的角度出发,注重幼儿健康、
为确保航空器在自由飞行空域中安全飞行,需要建立自由飞行下的碰撞风险计算模型,评估其碰撞风险。借鉴非自由飞行下的Event碰撞风险评估模型构想,根据自由飞行的特点,将碰撞
近年来,碳酸盐岩储层逐渐成为世界各国勘探的一个重点.本文结合碳酸盐岩的地球物理特征,简要介绍了目前在碳酸盐岩储层预测中应用的一些主要地球物理方法,探讨了各种方法的应用基
幼儿园班级文化是幼儿园教师实施的所有课程内容,同时也有教师自身的发展与家长的互动等等。它包括整个班级的教师、幼儿、家长,是幼儿园集体教育作用下的产物。应从"班级文
<正> 结构一切文章都有一定的结构。刘勰认为结构的原则是“总文理,统首尾,定与夺,合涯际,弥纶一篇,使杂而不越”。他把安排结构比作“筑室”。(《文心雕龙·附会》)李渔认为