多视角三维人体骨架重建的若干关键技术研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:xialin1983922
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多视角三维人体骨架重建是一种利用多视角图像/视频实现三维人体建模的重要手段,广泛应用于影视动画、电子游戏、运动分析、医疗康复和互动娱乐等领域,长期以来一直都是计算机视觉领域的研究热点之一。多视角三维人体骨架主要包括基于标记的光学动作捕捉技术和纯视觉的多视角3D人体姿态估计两种实现方式。近年来,尽管针对这两种方式的研究取得了重要进展,但依然面临许多挑战。基于标记的光学动作捕捉技术在多视角特征点匹配过程中非常容易出现漏匹配和误匹配现象,此外非刚体内部结构的不稳定性和长间隔缺失骨架节点为三维人体骨架识别造成了很大困难。纯视觉多视角3D人体姿态估计在多视角信息融合过程中面临冗余信息的干扰,缺乏多视图有效信息融合的相关研究。针对上述挑战,本文从多相机标定、人体稀疏重建、连续帧三维人体骨架识别、三维人体骨架缺失骨架节点修复和多视图特征融合这几个方面展开研究,利用基于标记的光学动作捕捉技术提出了一套完整的重建三维人体骨架的算法和模型,为多视角3D人体姿态估计研制了一种实现多视图有效特征融合的注意力机制,取得的主要研究成果展示如下:第一,针对多相机标定主要受外部参数初值和光束平差法的目标函数影响,提出了一种基于权重约束的多相机标定方法。首先,提出了一种基于参照点的多相机外部参数初值计算算法,该算法以L型框架上四个标记作为参照点来构造世界坐标系,为了准确地定位参照点在相机坐标系下的位置,构建了多个权重非线性约束组成的目标函数,并采用LM算法对其优化,随后通过模拟平移旋转世界坐标系使其与相机坐标系重合的过程,计算多相机外部参数初值。其次,为了进一步增强了光束平差法优化多相机参数的效果,赋予其目标函数的重投影约束和杆长重建约束以相应权重,并采用稀疏LM算法实现快速收敛,动态杆长测量结果表明其误差较不使用权重下降了24%。静态杆长测量结果表明其误差低至亚毫米级,优于多种先进的多相机标定方法。人体稀疏重建测试结果表明其标定效果优于商用动作捕捉分析软件Cortex。第二,为了重建三维人体骨架节点,提出了一种基于循环投票法的人体稀疏重建方法。针对多视角特征点匹配过程中常见的漏匹配和错匹配问题,提出了一种“粗匹配→精细化匹配”的两阶段匹配方法。首先,为了确定各个视角的二维观察点相互之间的潜在匹配关系,基于双极线约束构造了一个匹配字典。其次,在精细匹配阶段,提出了一种循环投票机制,通过全局投票减少漏匹配点,通过组内投票剔除误配点,针对双极线约束的缺陷,采用RANSAC算法筛除匹配组内的重建异常点。在利用匹配组计算稀疏点三维坐标时,进一步构造了几何误差代价函数,优化了匹配组中点的位置。实验结果表明,所提出的人体稀疏重建方法获得了比多种先进的NRSFM方法更好的位置精度,与商用动作捕捉分析软件Cortex相比较,在不增加误匹配的前提下降低了4倍的漏匹配。第三,为了从连续帧的散乱稀疏点集中识别三维人体骨架结构,提出了一种结合模板匹配和特征点跟踪的识别方法,以及一种融合骨骼长度约束的基于Long Short-Term Memory(LSTM)网络的人体骨架缺失点修复模型。针对三维人体骨架的非刚体特性,为模板边设置了可伸缩范围,提出了一种基于模板匹配的单帧人体骨架整体识别算法,首先构造模板边和模板点的候选匹配字典,随后逐边逐点地识别三维人体骨架模板。为了提高连续帧的三维人体骨架识别效率,将连续帧的三维人体骨架识别问题转换为前后帧实时点的跟踪问题,并提出了一种结合卡尔曼滤波和整体识别方法的跟踪方法,该方法在多种类型的人体运动序列上的平均识别准确率高达91.7%。针对三维人体骨架运动序列的长间隔缺失点修复问题,采用LSTM网络建模三维人体骨架运动序列的时空关系,设计了一种融合骨骼长度约束的损失函数,将长间隔缺失点修复误差减少了37.5%。此外,基于TCN和ODE-RNNs等时空关系建模方法的测试结果进一步验证了融合骨骼长度约束的有效性。第四,为了学习紧凑的3D人体姿态表征,提出了一种基于MVP-att的多视角3D人体姿态估计模型。针对多视角有效信息融合这一挑战,提出了一种名为MVP-att的多视角注意力机制,它赋予多视角3D人体姿态估计模型自动融合多视图有效深度特征的能力。MVP-att模块利用通道注意力机制学习多视图深度特征通道之间的相关性,随后通过学习不同通道特征图的空间相关性,为每个通道特征图的像素学习注意力权重,生成权重深度特征,并将其聚合成统一的3D人体姿态表征。MVP-att模块可以灵活地嵌入端到端学习的3D人体姿态估计模型,能够取得比1×1卷积层更好的特征融合效果,同时参数量减少了76%。在多个大型公开数据集上的实验结果表明基于MVP-att的多视角3D人体姿态估计模型优于近年来的许多先进方法。
其他文献
核能是我国能源发展的中长期国家战略,十四五规划后我国核电建设迎来了高速发展趋势,但是我国先进堆型数量占比仅为世界总量的6%,影响核电产业国产化的“卡脖子”技术之一便是核燃料组件格架的基本单元条带冲制技术。条带是提供燃料棒径向和轴向支撑定位,使其保持合理的间距及均匀的夹持力,确保水流、热流传导的均匀化,是避免燃料管破裂及核燃料泄漏的关键。因此,对条带的冲制成形尺寸精度、几何精度及成形质量等在内的关键
学位
水稻(Oryza sativa L.)是当今世界最重要的粮食作物之一,全球半数以上人口以稻米作为主食。作物产量形成的物质基础来源于光合作用,利用C4型光合碳固定通路相关基因提高水稻光合作用效率,对保证粮食安全具有重大的理论和实际意义。利用创制的相关转基因材料,本文对转ZmPEPC+ZmPPDK双基因水稻(KC)、转TlPDRP单基因水稻(P)、ZmPEPC+ZmPPDK/TlPDRP三基因聚合水稻
学位
建筑墙体多为多孔介质材料,其内部传热与传质过程同时进行。热湿传递相互耦合、机理复杂且模型高度非线性。在降雨较多的南方湿热地区,风驱雨会影响墙体内温度和含湿量分布,造成墙体内部湿分积聚、冷凝和发霉等问题。研究风驱雨对墙体热湿性能的影响对准确计算墙体传递冷热负荷、优化墙体保温厚度以及改善与墙体传湿有关的室内空气品质问题等方面具有重要意义。本文以多孔介质传热传质理论为基础,建立超吸湿条件下热湿耦合传递数
学位
本文主要研究各向异性椭圆方程弱解的Liouville定理及其部分正则性理论,还研究了各向异性Liouville方程极值解的存在性及正则性等问题.第一章,简单介绍了研究问题的背景,意义以及本文的主要结果.同时也简单回忆了本文所需的一些基本知识.第二章,在全空间上研究如下各向异性方程-Qu=f(u),x ∈RN,其中f(u)=eu,up且p>3,-u-p且p>1/3.算子Q通常被称为Finsler拉普
学位
随着工业的大力发展,迅速增长的能源需求和全球环境恶化被认为是制约发展的突出问题。抗生素在水生系统中的普遍存在及引起的环境质量和公众健康已经成为一个环境问题。四环素(TC)是使用最广泛的抗生素之一,常被用于疾病控制和促进动物生长。含TC废水的处理已引起人们的关注,但如何高效低能耗的去除水体中抗生素仍是一个未完全解决的问题。基于太阳能的光催化技术是一个有效的途径,而光催化剂在光催化反应过程中起核心主导
学位
树脂传递模塑成型工艺是复合材料成型的重要工艺之一,已受到汽车行业广泛关注。其工艺过程主要分为织物预成型和树脂注射两个阶段。在织物预成型阶段中,由于织物固有的粘弹性特性,其在厚度方向被压缩时,难以达到指定纤维体积分数。此外,织物在空间成型成为三维形状,变形模式与机理复杂,不合理的工艺参数极易诱发成型缺陷。预成型阶段得到的织物预成型体对复合材料目标力学性能有重要影响。然而,目前针对车身用复合材料常用的
学位
在航空发动机中,存在数量庞大的风扇叶片、涡轮叶片、压气机叶片等具有异形曲面结构的核心零部件,其优异的质量是航空发动机稳定运行的首要前提。除了需要对叶片本身的加工工艺提出严格的要求,测量技术也是为制造质量保驾护航不可或缺的手段。近年来,随着光学测量技术的发展,非接触式三维视觉传感器逐渐替代以三坐标测量仪为代表的接触式自动化测量设备,完成叶片三维尺寸测量、形貌测量等任务。然而,这类非接触式三维传感器在
学位
无人机在军事和民用领域应用潜力巨大,而安全控制是保障其稳定飞行的关键技术之一。随着无人机的发展,被控对象、作业环境、飞行工况日益复杂化,对其任务执行品质和作业安全性能的要求也越来越高。然而,无人机的安全可靠飞行受限于多种因素,包括复杂环境中的静/动态障碍物、系统部件故障、多源异质干扰、以及系统自身能力限制。首先,随着作业环境变化和空间拓展,无人机在执行作业任务时可能遭遇静/动态障碍物,因气动约束、
学位
核酸是重要的生物大分子,通过复制、转录和翻译对遗传信息进行储存和传递。核酸具有多态性,通过碱基之间的Watson-Crick氢键和Hoogsteen氢键连接形成多种二级结构,包括发卡环、三联体、G-四链体(G4)和i-motif等。其中G-四链体由富含鸟嘌呤的核酸折叠而成,四个鸟嘌呤形成二维G-平面结构,两个以上的G-平面通过π-π堆叠作用构建稳定的G4。G4广泛存在于基因组中,并且参与DNA复制
学位
与折射式光学元件和基于动力学相位的传统衍射型光学元件相比,基于几何相位的平面光子学元件可以增加系统的自由度,具有体积小、轻薄、精度高、效率高等诸多优点。因此,几何相位衍射光学元件及其应用近年来受到广泛的关注。液晶,作为一种特殊的三维自组装软物质形功能材料,因其既具有液体的流动性又具有晶体的各向异性而在显示和光子学领域发挥着不可替代的作用。基于液晶的几何相位元件因其可对光的偏振、相位、波矢等进行调制
学位