人体三维姿态参数估计方法的研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:szgang052809
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过图像或视频进行人体三维姿态参数估计是当前计算机视觉领域的研究热点之一,其中包含的深度信息对于虚拟现实、智能监控、无人驾驶、游戏动画等技术具有很重要的意义。然而从视频图像中估计人体姿态面临着数据集限制、人体姿态歧义和严重的遮挡等问题。本文主要研究二维关键点序列作为输入的两阶段人体三维姿态参数估计方法,实现输入视频序列中的人体姿态深度信息更准确估计和可视化。本文的主要研究内容如下:1.研究了基于序列图卷积和时间卷积网络的人体三维姿态估计方法,主要将用于动作识别的时空图卷积网络结构应用到人体三维姿态估计中获取序列图结构的空间特征、时间特征。针对时空图卷积网络在输入序列长度较大时,存在建立序列图结构体积较大导致的计算量大和网络训练时间长的问题,使用时间卷积网络模块在提取时间特征的同时减小序列图结构体积的特性对时空图卷积网络进行改进。在公开数据集中训练结果表明基于序列图卷积和时间卷积的方法优于目前的人体三维姿态估计中的一些典型方法。2.研究了基于图注意力的人体三维姿态估计方法,主要使用图注意力机制对时序卷积网络方法进行改进。利用图注意力网络解决时序卷积网络中只获取时序特征而未使用空间特征信息的问题以及图卷积方法中对于邻接节点权重分布相同,导致的空间信息相关性获取受限的问题。根据节点之间的相关性程度为不同的节点分配不同的权重,通过邻接矩阵区分节点间的邻接关系来获得节点间的局部特征信息。结合时序特征和空间特征,在公开数据集上测试表明基于图注意力方法的三维估计结果与原始时序卷积网络方法相比有明显提升。3.研究了视频的人体三维姿态估计及可视化,通过搭建一个姿态估计可视化平台,可以对输入的任意网络视频进行三维姿态估计并获得可视化结果。研究由于二维姿态估计坐标值过渡不连续导致的三维估计结果抖动问题,采用平滑滤波器对二维估计值进行预处理后再调用三维模型进行姿态估计,使得可视化效果更接近真实视频。实现了以客户端和服务端为基础的数据文件收发一体化姿态估计平台。经理论分析及网络视频测试表明,此姿态估计平台能较好的获得三维姿态可视化结果。
其他文献
认知雷达将感知到的环境信息反馈给发射端,使其能够及时调整发射策略提升目标检测、抗干扰等性能,成为目前机载雷达领域的研究热点。射频(Radio Frequency,RF)隐身波形设计技术是提升机载雷达发射性能的有效途径。该技术主要通过优化模型建立和算法求解得到RF隐身波形,并结合先进的信号处理方法,提高机载雷达的低截获(Low Probability of Interception,LPI)、低识别
学位
双相情感障碍(Bipolar disorder,BD)是一种严重的情绪障碍类疾病,找到对其有效鉴别的生物学指标是一项有意义的工作。本文采用静息态脑磁图(Magnetoencephalography,MEG)数据,采用了以振幅包络相关代表的传统功能连接指标和来源于静息态功能核磁共振(functional Magnetic Resonance Imaging,f MRI)的动态功能连接新方法——共激活
学位
毫米波无线通信因其极宽带宽、干净的频谱资源、极高的传输效率、较好的物理保密性、器件易小型化、组网相对灵活的特点,得到了广泛关注,成为第五代移动通信系统(5th Generation Mobile Communication Technology,5G)的关键技术,并在一些特殊领域有逐渐替代传统有线通信的势头。由于毫米波频率较高,其传播特性与低频微波通信系统相比有明显不同,研究毫米波无线信道特性是研
学位
多基线干涉合成孔径雷达(Synthetic Aperture Radar,SAR)是传统SAR成像技术的扩展,主要利用不同高度航过形成高度维虚拟大孔径,从而获取高度维分辨,再结合传统SAR二维成像能力实现观测场景的三维成像,在陡峭起伏地形、城市环境测绘具有重要研究和应用价值。但是,传统匹配滤波成像算法在多基线干涉SAR高度维成像时面临低分辨、高旁瓣、强栅瓣等问题,亟需开展高精度的成像新方法研究。面
学位
视频作为人们获取信息最快捷、高效的数据形式,已经成为了人们日常生活以及互联网数据中最重要的组成部分。随着互联网和自媒体的蓬勃发展,每天都会有海量的视频数据涌入互联网,这对网络带宽、终端设备的存储能力等都带来了挑战。因此,视频编码,旨在减少视频数据量的同时不引入过多的失真,就成为了诸多以视频为主要媒介的应用场景的核心技术之一。高效视频编码标准(High Efficiency Video Coding
学位
随着图像处理技术和计算机技术的发展,可逆信息隐藏技术因其具有从载密图像中准确无误地提取秘密信息的同时又能无失真地恢复原始载体图像的特点,在信息安全和知识产权保护领域逐渐得到重视。在载体对象的任何失真都可能会造成严重后果的某些特定的场合下,该技术更彰显出极为明显的优势。因此研究可逆信息隐藏技术对机关和军事部门的秘密文件,航天领域的数据和图像,企业部门的绝密方案和设计图等安全有效地传输具有极其重要的意
学位
无线传感器网络以其成本低廉、可扩展性强、稳定性高的特点,在国防军事、工业监控、环境检测、智慧生活等领域广泛应用。时间同步是无线传感器网络能正常进行数据检测、传输、融合的前提。受到无线传感器网络节点计算能力低、存储容量小、通信范围近、能量受限等因素的制约,其时间同步算法的发展仍存在较多难题。本文主要研究无线传感器网络的一致性时间同步算法,主要工作如下:第一,针对需要工作半年以上的无线传感器网络,在同
学位
全球化的市场竞争对物流成本和物流配送时间、质量的要求不断提高,这对企业的物流管理水平提出了更高的要求。近年来集成化的物流网络设计得到了管理者和研究人员广泛关注,物流领域研究更多的将物流网络设计和库存策略等物流管理的关键环节同时进行决策,以帮助企业降低整体物流成本和提高物流服务水平。本文研究了一个带有容量限制的集成物流网络设计问题,包括一个外部供应商,一组带有容量限制的备选配送中心和一组给定的零售商
学位
目的:观察外固定治疗创伤性四肢骨折的疗效及其对术后炎症应激反应的影响。方法:选取创伤性四肢骨折患者50例,随机分为外固定治疗的观察组25例与切开复位内固定治疗的对照组25例,观察患者治疗效果、炎性应激反应、出血量及术后恢复情况、并发症发生率。结果:与对照组患者相比,观察组患者优良率高,炎性应激反应指标水平低,出血量少,术后恢复时间短,并发症发生率低,差异有统计学意义(P<0.05)。结论:给予创伤
期刊
三维点云通过表示位置的坐标信息与反射率、颜色等属性信息,来表征三维场景以及场景内人或物的轮廓信息与结构信息,其在自动驾驶、虚拟现实等场景中得到了广泛地应用。但是海量的点云数据必然是难以储存与传输的,所以实现对点云数据的高效率压缩具有重要的意义。因此,国家音视频标准(Audio Video Standard,简称AVS)工作组发布了一种点云参考软件模型(Point Cloud Reference s
学位