基于深度对抗式学习的三维人体姿态估计

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：yigenjin2009

【摘要】

：

【作者】

：

崔健

【机构】

：

西安电子科技大学

【出处】

：

西安电子科技大学

【发表日期】

：

2021年01期

【关键词】

：

三维人体姿态估计生成对抗网络深度学习计算机视觉

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

三维人体姿态估计是对图像或者视频中出现的人体进行准确的关节点定位,抽象出一个三维人体骨骼形状,以便后续的动作分析和行为识别。它是很多高级计算机视觉任务的基础,能够广泛的应用于视频监控、步态分析、动作捕捉以及体感人机交互领域。随着深度神经网络模型的飞速发展,三维人体姿态估计方法也在日益革新。基于深度学习的两阶段三维人体姿态估计方法首先将图像传入预训练的二维姿态提取网络获取二维人体关节点坐标,然后再通过神经网络建立二维关节点到三维坐标点的映射,这类两阶段方法在实际应用中展示出了良好的效果。但在二维姿态到三维姿态的变换中,现有的方法大都通过大量标注数据进行有监督迭代训练,一方面忽略了数据在分布上的有效信息,另一方面造成了单一数据集上的过拟合现象。在实际应用中,稀少的三维人体姿态标注数据也制约了有监督方法的进一步应用,无法满足多种场景下三维人体姿态估计网络的训练。近年来,生成对抗网络技术飞速发展,通过网络的对抗性学习,能够有效的提取数据分布的信息。因此本文主要是在深度对抗式学习框架下,利用生成对抗网络对不同训练场景下的三维人体姿态估计问题进行了研究,具体内容如下:1、现有的有监督三维姿态估计方法在重建三维人体姿态时大都没有考虑到姿态数据的分布特性。本文以此为出发点,提出了一种姿态投影生成对抗网络用于有监督三维姿态估计。通过构建特殊的投影判别器为有监督模型提供两种新的约束信息,从而提升三维人体姿态估计的精度。本文分别利用改进版Wasserstein生成对抗网络（WGAN-GP）和最小二乘生成对抗网络（LSGAN）两种对抗式学习算法对模型的有效性进行了验证分析。定性定量分析表明,通过投影判别器引入新的约束,能够有效提高有监督模型的精度。2、有效学习姿态数据的分布信息可以进一步减弱训练过程对真实三维姿态标签数据的依赖。本文基于WGAN-GP生成对抗网络,利用姿态数据在变化过程中自身的结构特性,分别设计了弱监督循环投影网络和无监督双向投影网络用于三维姿态的重建。其中,循环投影网络在训练过程中不需要三维姿态与二维姿态数据之间明确的对应关系;双向投影变换从两个方面对三维姿态的重建过程进行了约束,充分挖掘了姿态数据自身的物理特性,能够不依赖三维姿态数据完成模型的训练,实验在MPII和Human3.6M数据集上都实现了有竞争力的重建效果。

其他文献

智能安全帽系统的设计与实现

随着现代科技进步和城市化进程加快,建筑行业智能化发展不断深入。在建筑行业中,安全帽作为最基本的安全防护措施,能够做到工人施工环境全覆盖。将安全帽作为智慧工地系统的智能终端采集设备,可以实现工人施工环境全范围监测,使得安全帽的作用得到延伸和扩展,促进工地智能化发展进程。不同类型智能安全帽在功能设计上有所不同,但基本都具备数据传输能力,其采用的传输协议各有不同,缺乏统一规范。因此,本文提出基于GB/T

学位

安全帽传输协议国家标准多媒体技术

基于时空数据的用户轨迹相似性度量及应用

学位

局部离群因子算法的改进及其在监所风险人员识别中的应用

学位

清明节扫墓有感

期刊

基于计算机视觉的运动目标检测

智能监控系统已广泛应用于人民生产生活的方方面面,小到居家住所,大到公共场所,它不仅能帮助人们保障自身权益、维护财产安全,更有助于维护整个社会的治安稳定。智能监控系统涉及运动目标检测、分类、跟踪及其行为理解等技术。本文围绕智能视频分析中的运动目标检测展开研究,以达到在复杂的视频场景下准确检测运动目标的目的,更好地保障智能监控系统决策的正确性。针对传统的Vi Be算法中存在运动物体或者原本静止的物体突

学位

运动目标检测图像分割自适应ViBe算法阴影邻域相关度

基于语义卷积神经网络和生成对抗学习的SAR图像变化检测方法

合成孔径雷达（Synthetic Aperture Radar,SAR）因其全天时、全天候的工作能力与穿透力强等特性,被广泛应用于遥感技术领域。SAR图像变化检测是通过定性定量分析同一区域不同时相的SAR图像来获取地物变化信息的方法。SAR图像由于自身成像机理导致图像含有大量相干斑噪声,这给SAR图像变化检测带来了极大的挑战。本文首先介绍了SAR图像变化检测的研究现状,在对现有变化检测方法优缺点分

学位

SAR图像变化检测结构语义信息级联空洞卷积生成对抗网络

基于多任务学习与代理模型的多目标跟踪方法

多目标跟踪任务是计算机视觉领域中的关键任务,其是目标检测、图像分割等任务的进一步发展,也是人体姿态估计、行为识别与分析等高级任务的基石,具有丰富的研究和实用价值。多目标跟踪任务的目的是识别和检测出视频帧中所有的目标,并保证每个目标在其所在视频帧中的身份信息不变,即对每个目标维持一个相同的ID编号。目前对多目标跟踪任务的处理框架主要分为四个步骤,包括目标检测、特征向量提取、相似度计算和数据关联。研究

学位

多目标跟踪多任务学习级联匹配注意力机制上采样代理模型

SDN控制器部署的多目标优化模型及其智能算法研究

随着移动通信技术的迅速发展和互联网相关应用的逐渐普及,当前信息网络正在向着大容量、高带宽、高可靠性、低延时和广覆盖发展。借助软件定义网络（Software Defined Network,SDN）技术,网络设备制造和运营商可以在基于密集波分复用的光网络（Optical Networks with Dense Wavelength Division Multiplexing,ON-DWDM）中实现光

学位

(超)多目标组合优化Pareto前沿控制器放置问题混合进化算法信息熵感知

面向无线传感器网络高效率CMOS功率放大器设计

近年来,随着传感器设备和无线通信技术的发展,无线传感器网络受到了极大的关注。无线传感器网络的广泛使用使得远程监控物理环境变得更加容易,但是其低功耗、小成本与有限的网络寿命等特点为收发机系统带来了一系列挑战,尤其是对片上功率放大器的设计提出了很高的要求。基于这一背景,本论文对高效率CMOS功率放大器展开了研究。本论文分析了功率放大器在无线传感网络中的应用,对当前国内外提出的CMOS功率放大器所使用的

学位

无线传感器网络功率放大器CMOSAB类电容补偿技术

云环境下作业调度算法的研究与实现

随着互联网、物联网和人工智能等技术的广泛应用,大数据分析在各行各业中都变得越来越重要。如今的大数据处理系统,如Hadoop Map Reduce、Spark和Flink等,都将上层的大数据应用抽象为一组待调度的作业。由于数据处理作业的逻辑高度复杂,所处理的大数据作业状态动态变化,现有的静态作业调度算法考虑的重点有限,无法同时兼顾调度算法的高性能与集群资源的高效使用。因此,如何设计合适的调度器,使得

学位

大数据云计算作业调度时间预测

基于深度对抗式学习的三维人体姿态估计

与本文相关的学术论文