基于注意力机制的人体运动检测与姿态估计

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:hlyhky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体运动检测与姿态估计是深度学习与计算机视觉中最具挑战问题之一,在智能监控、人机交互、动作识别等领域有着广泛的应用。本文提出了基于内容描述特征的注意力机制、基于注意力机制的人体运动检测算法、基于注意力机制的人体姿态估计算法。本文的工作内容如下:首先,由于卷积神经网络中的浅层内容描述特征与深层高级语义特征相互补充,但现有方法未能充分利用浅层内容描述特征,所以本文提出了基于内容描述特征的注意力机制。提出的注意力机制对输入的内容描述特征显式建模,通过提取多尺度内容描述特征,并进行自适应地选择与融合来自不同分支的多尺度内容描述特征。最后,融合后的多尺度内容描述特征通过门控机制,对骨干网络输出的高级语义特征进行重新校准,选择性地强调高级语义特征的有效信息,并抑制无用信息。提出的基于内容描述特征的注意力机制在Image Net分类数据集中实现了5.47%的Top-5错误率,在MS-COCO数据集的目标检测任务中实现了41.8%的平均精度。其次,针对人体运动检测算法的骨干网络通常使用上采样或反卷积生成的高分辨率特征表示,造成预测热力图在空间中不够准确,本文提出了加权特征融合高分辨率网络。加权特征融合高分辨率网络为不同尺度的特征表示赋予了额外的可学习权重,使得网络可以学习不同分辨率特征表示的重要性,并利用提出的内容描述注意力机制,对网络输出的高级语义特征进行校准。针对非极大值抑制仅使用交并比作为预测框相似性度量,易删除正确预测框造成漏检,本文提出了基于曼哈顿距离的非极大值机制,使用曼哈顿距离作为判断两个预测框之间是否相似的度量标准。基于以上改进,提出的算法在MS-COCO数据集中实现了60.8%的人体运动检测平均精度。最后,针对现有人体姿态估计算法的参数量与运算量较大,难以实时运行的问题,本文提出了互补型特征金字塔网络。该网络首先使用了提出的特征融合瓶颈模块,利用分层连接,将不同感受野的特征融合在一个单一的瓶颈模块中,扩展了每个瓶颈模块的感受野的范围。为了减少网络优化过程中的冗余梯度信息,构建轻量级网络,在互补型特征金字塔网络中引入了跨阶段局部连接。提出互补特征融合注意力机制,实现了自适应地选择不同层次的互补信息进行融合,使有效特征在网络的输出中最大化。基于以上改进,提出的算法在MS-COCO数据集的人体姿态估计任务中实现了72.7%的平均精度。
其他文献
近年来,针对地铁直流牵引供电系统中杂散电流和轨道电位传统治理方式的不足,零阻变换器系统(zero-resistance system,ZRS)被提出。ZRS跟既有牵引供电系统(traction power system,TPS)并联,通过负阻变换器(negative resistance converter,NRC)、开关单元(switch unit,SU)、回流线缆(return cable,R
重力坝计算原理简单、可建地质类型广泛,是水电水利工程重点结构之一。抗滑稳定是重力坝安全设计中的研究重点,其主要分析方法:单一安全系数法、分项系数极限状态设计法以及可靠度理论设计法。目前实际工程主要采用单一安全系数法。然而,我国现行的水利行业标准《混凝土重力坝设计规范(SL319-2018)》提供了重力坝工程允许安全系数取值规定,此标准中,规定正常工况下允许安全系数均取3。该允许安全系数由工程经验决
氧化锌作为一种透射率高,性质稳定,环保的材料,在有机光伏器件与有机发光二极管研究中被广泛使用。在这些器件中,氧化锌修饰层的主要作用是增强电子传输性能。因此,减少氧化锌薄膜中的缺陷是提高器件性能的关键。所以,在氧化锌修饰层的制备中,紫外、高温、表面包覆等方法被广泛应用。而与以上器件不同的是,有机光电探测器作为一种检测光信号,尤其是弱光信号的光电器件,降低暗电流是提高探测器性能的关键手段之一。而光电子
近年来随着船舶执行的任务越来越复杂,人们对欠驱动船舶自动控制系统提出了更高的要求。自动靠泊系统是实现高效安全航行所不可或缺的一部分。随着无人船技术的发展,建立高效、准确的智能自动靠泊系统具有重要的实践意义。强化学习方法由于具有解决复杂控制与决策问题的潜力,已经成为目前人工智能领域热点研究方向,结合了强化学习与模仿学习的示教强化学习(RLf D)方法通过各类专家策略提供的数据可以提高智能体训练速度和
随着信息时代的到来,计算机文档分析与识别在内容识别、基于内容的检索等领域具有重要的意义,因而成为信息处理领域的重要研究课题之一。其中文档版面分割是文档分析与识别的关键处理步骤,是指将文档版面划分为背景、文本、表格、图片等不同区域。版面分割的精度将直接影响文档分析与识别系统的整体性能。近年来深度学习方法的出现,使得文档版面分割任务取得了很大的进展。但由于文档版面布局灵活复杂、各区域尺寸相差大、元素形
随着我国轨道交通网络的形成和发展,全国轨道交通车辆保有量、运营里程逐年增加,轨道交通行业开始进入到建设与运营维护并重阶段。当前,随着轨道交通车辆的服役数量和服役年限的不断增长,轨道交通车辆的检修需求日益增加,给轨道交通检修行业带来了发展机遇和挑战。当前轨道交通车辆架修密集期的到来对检修企业提出了更高的要求,检修企业需要在保证检修质量的情况下满足快速交付的需求。但是由于轨道交通检修行业的特殊性,检修
目前我国仍采用容许应力法进行铁路桥梁设计,但随着我国铁路事业的不断发展,国内企业同国外合作项目日益增多,容许应力法已不能满足我国和国际间技术交流的需要,故铁路桥梁设计方法急需从容许应力法向极限状态设计法转变。虽然已经有很多学者对欧美规范的桥梁极限状态设计方法进行研究,但缺少对重力式桥墩的极限状态分析,故本文通过采用中国容许应力法和欧美规范的极限状态设计法对铁路桥梁重力式桥墩进行对比研究,主要研究内
随着我国“一带一路”倡议的不断推进,中欧班列作为国家品牌迅速发展,成为促进中欧贸易的重要载体。目前,中欧班列开行数量增幅逐渐趋于稳定,运输网络逐步完善,提高运营水平是当前阶段的主要目标。现阶段中欧班列仍然存在运输效率难以保证、运到时限不稳定、对特殊状况难以做出调整等问题。因此,基于基本运行图框架,研究中欧班列实际运行计划的优化方法,对于中欧班列的运营水平提高具有重要的现实意义。基于以上问题,本文对
利用机械振动信号来估计振源对机械系统的优化设计、振动噪声控制、状态监测和故障诊断等有着重要意义。工作中的机械系统受到来自外部或内部的各种振源作用,因零部件故障引发的振源都属于内部激励源。从机械振动信号中获得内部激励产生的响应,分源进行评价,更有利于准确和鲁棒的状态监测及诊断。本文通过归纳内激励响应的性质,利用其结构属性,研究基于低秩恢复技术的三种分离模型,由构造的观测矩阵中得到内激励响应。(1)内
有机发光二极管(OLED)因众多优点受到科研人员的关注,未来可能会逐渐取代液晶显示技术,成为下一代主流显示技术。OLED从被发现至今已有70多年的历史,多年来对于OLED器件的研究和开发,使器件的性能不断提高和优化。尽管如此,OLED还是存在着一些缺点,比如使用寿命还不够高,还不能做到极高的分辨率,成本还比较高等。本文将简要介绍OLED器件有关的基础知识,针对目前已经商用的OLED器件与材料进行改