基于多视角相机阵列的人体运动捕捉技术

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:xukaiboy123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,随着相机硬件和深度学习技术的不断进步,人体运动捕捉技术逐渐成为计算机视觉领域的重要方向,可以通过图片或视频数据获取准确的2D人体骨架、3D人体骨架和人体模型等。在工业领域也有着很高的研究价值和发展前景,比如虚拟试衣、游戏电影特效、虚拟现实游戏和体育运动辅助训练等。但在实际工业应用中,大多都采用演员穿戴带有标记装置的特殊衣服来进行人体运动捕捉,借助装备的辅助可以获取非常精确的人体运动位姿,但这类装备使用成本昂贵且使用繁琐,无法推广使用。所以无标记捕捉系统对于人体运动捕捉的广泛应用很重要,但当场景中人数增多时会存在很严重的遮挡问题,对2D人体位姿估计和3D人体位姿估计的准确率有严重的影响,因此无标记人体运动捕捉仍然是一个具有挑战性和研究意义的问题。在上述背景下,本文针对无标记人体运动捕捉技术这一问题进行研究,并针对提高2D人体位姿估计、3D人体位姿估计和人体模型重建的效果。主要工作如下:首先,基于多视角相机阵列进行2D人体位姿估计。搭建了一套多视角相机阵列,由20个工业相机组成并进行标定,作为多人强交互运动图片数据的捕捉设备。利用人体关节点特征提取网络对采集得到的多视角图片数据提取初始特征和关节位置热度图。然后基于多视角特征融合和热图融合来改进2D人体位姿估计技术,以增强检测结果。可以充分利用多视角数据的优势,减轻单视角无法避免的遮挡问题对人体关节点检测效果的影响,对于被遮挡的关节点,无法检测得到以及错误匹配等问题都得到明显改善,方法的鲁棒性大大增强。其次,基于多视角相机阵列进行3D人体位姿估计。通过多视角相机阵列采集场景内人体运动数据,对图像首先进行2D人体位姿估计,并对各个视角的2D人体关节点进行跨视图匹配,利用人体区域一致性、2D人体关节点跨视图空间一致性、2D人体关节点单视图匹配一致性、2D人体关节点与3D人体关节点空间一致性等约束来提高人体关节点跨视图匹配的准确率。对优化匹配后的2D人体关节点采用最小二乘估计方法得到最优的3D人体关节点位置,并利用前后帧人体骨架之间的运动关系来保证人体骨架在时序上的一致性,能够保持追踪同一个人的人体骨架。最后,基于多视角相机阵列进行人体模型重建。通过多视角相机阵列采集场景内人体数据,再对输入图像进行3D人体位姿估计得到人体关节点位置信息,与SMPL模型定义的标准静止模型的人体关节点相计算得到各个关节点的全局和局部旋转矩阵,从而得到模型的人体姿态参数。并利用最小化包含多个误差项的目标函数来优化人体模型参数,减少人体关节点误差带来的影响,得到效果更好的SMPL人体模型。本文的人体运动捕捉技术基于多视角相机阵列进行,充分利用多视角数据更全面的人体信息,在2D人体位姿估计、3D人体位姿估计和人体模型重建方面都取得了比较好的效果。
其他文献
非正交多址(Non-Orthogonal Multiple Access,NOMA)技术的核心思想是在同一个资源块同时为多个用户提供服务。但是由于NOMA接收端串行干扰消除(Successive Interference Canaeller,SIC)解码的特殊性,将用户全部通过NOMA服务会使得接收端的复杂度很高同时解码错误大大增加。因此,有必要将用户分簇/配对,分簇/配对后的用户通过NOMA服务
学位
随着CT影像技术在现代医学诊断和治疗过程中的应用越来越广泛,CT检查中潜在的辐射风险也引起了人们的广泛关注,过量的辐射容易诱发白血病以及癌症等疾病,因此,降低CT扫描过程中的辐射剂量刻不容缓。使用间隔一定角度扫描的稀疏采样方法可以获得辐射剂量低的稀疏角度CT图像,但是获得的稀疏角度CT图像中存在伪影,降低了图像的质量,影响医生的诊断。本文以去除稀疏角度CT图像中的伪影和增强CT图像细节为目标,构建
学位
随着服务机器人在家庭环境中的广泛使用,如何让机器人有效地学习复杂操作技能是机器人操作技能学习领域的研究重点。本文基于行为树和强化学习针对家庭环境中的开门放置药瓶复杂操作技能,从模仿学习和强化学习两种角度开展研究。论文主要研究内容如下:(1)结合软硬件建立了服务机械臂操作实验系统和技能学习框架。操作实验系统通过ROS将系统软硬件进行连接,完成了Kinecct V2相机与Kinova Jaco2机械臂
学位
大数据时代,随着计算机技术和人工智能技术的快速发展,在世界范围内有越来越多的数据被记录、存储和使用。大量数据伴随着互联网的广泛应用,促进了科技的进步,给人们生活带来了便利。随着数据分析技术的发展和各式各样数据挖掘算法的提出,数据的传播和共享越来越频繁。文本、语音以及图像等多样化数据更为广泛的传播,使得人们隐私受到严重威胁,数据隐私保护成为越来越严峻的问题。如何在保护数据隐私的同时还要保留数据一定程
学位
中共中央、国务院于2020年10月印发的《深化新时代教育评价改革总体方案》中提到“坚持科学有效,改进结果评价,强化过程评价,探索增值评价,健全综合评价,充分利用信息技术,提高教育评价的科学性、专业性、客观性。”,充分说明改革教学评价体系是建设新时代高等院校高质量教学发展的关键。提高教学评价体系的科学性、准确性是目前亟需解决的重要课题。本文的研究旨在利用高校学生评教数据和数据挖掘中的相关算法实现评教
学位
机械臂在工业和服务领域有着广泛的应用,抓取是机械臂的重要技能,也是机器人学习领域的研究热点。基于深度强化学习的抓取方法能够通过自主学习完成端到端抓取,但此类方法存在学习效率低的问题。针对深度强化学习在机械臂抓取中存在的问题,本文提出了一种基于强化学习与元学习的机械臂抓取方法,从增加正向奖励、学习归纳偏置、降低任务复杂度三个方面提高学习效率。本文主要研究内容如下:(1)利用深度确定性策略梯度算法(D
学位
软件仿冒自互联网时代开始以来就广泛存在,Android系统凭借其开放性、普及性等特点,吸引了大量的用户群体,建立起庞大的应用生态环境,其中不仅包含各种良性应用,也充斥着大量仿冒应用。得益于前人广泛的研究,移动应用业界对各类仿冒应用已具备充分的理解,衍生出了对应的检测机制与防护措施,能够有效减少仿冒应用对用户财产的侵害。然而,近年来混淆等技术的普及使得仿冒应用难以被传统的检测方法检测,开发出高效、自
学位
随着科学技术发展与应用,多智能体系统被广泛的应用于日常生活当中。Euler-Lagrange系统属于多智能体系统中一类较为复杂的非线性网络系统,并广泛应用于无人机编队控制,机器人编队控制等等。对Euler-Lagrange系统的研究有着非常重要的意义和价值。网络攻击在许多系统中都是一个无法避免的问题,网络攻击可能会使多智能体系统的通信信息被窃取篡改,进而导致多智能体系统性能下降,甚至完不成预期任务
学位
在对机械臂进行控制时,通常需要对机械臂进行逆运动学求解,以求得机械臂到达目标位置各关节需要转动的角度。对于多自由度机械臂,传统逆运动学求解方法如雅克比矩阵法、牛顿迭代法等存在计算量大、实时性差等缺陷,解析解法又对机械臂的几何构型有着特殊要求,通用性差。针对有较高实时性要求的多自由度机械臂末端位姿控制问题,本文提出基于并行CCD的机械臂位姿控制方法,首先通过正运动学或位置传感器等手段实时获取机械臂各
学位
将文化嵌入到区域品牌产品是维持文化资源可持续发展的重要途径,也是使区域获得竞争优势和高质量发展的手段,但是目前较少被关注.因此,本研究结合计划行为理论(TPB),提出了一个新的概念模型并进行了实证分析.基于该模型,分析了区域品牌产品的文化嵌入、感知价值和对区域品牌产品文化嵌入的态度三个因素对行为忠诚的直接和间接影响.本研究以武当山文化区域品牌产品为例,基于313个样本调查数据,采用偏最小二乘结构方
期刊