基于级联预测和多注意力特征融合的人体姿态估计研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:sjk29001431
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态估计任务的目标是通过算法检测出分布在图像数据中的人体骨架点,例如头部、手部、胯部等。作为计算机视觉领域基础而又艰巨的任务之一,人体姿态估计在行人重识别、行为识别、人机交互等领域都有着广泛应用。尽管随着硬件水平的提升以及深度学习的引入,人体姿态估计任务的算法性能得到跨越式提升,但是依然存在一系列问题。首先,现有单阶段网络特征学习低效,且网络过深易引起梯度下降甚至消失等问题。多阶段网络常用中继监督的方式补充梯度,但是中继监督只考虑了输出与真实标签的误差,忽视了各层次输出之间的内在联系。其次,在人体姿态估计任务中,局部信息和全局信息都有助于骨架点定位,而现有网络依靠大量卷积结构进行特征提取,缺乏保留关键特征能力和特征利用能力,消耗较多资源但性能提升有限。针对以上问题,本文做出了以下改进:(1)针对现有网络特征学习低效,网络过深易引起梯度下降等问题,提出基于级联预测的人体姿态估计算法(CP-Net)。算法结合中继监督与知识蒸馏提出合并监督算法,对网络构造不同层次输出预测并施加不同的监督方式。通过合并监督,浅层特征与深层特征建立起隐形关系,提高学习效率,网络梯度也得到补充。在合并监督算法的基础上,进一步提出级联预测特征融合模块。通过简单分支,对浅层预测特征进一步提取并累加至深层特征生成深层预测,浅层子网所包含的上下文语义特征及定位信息作为深层特征的补充以及先验知识,促进骨架点定位及分类任务。(2)针对现有网络提取人体姿态估计关键信息能力弱,特征利用不充分等问题,提出基于多注意力特征融合的人体姿态估计算法(MAFF-Net)。算法基于对现有注意力模块的了解设计非降维通道注意力模块(NDRCA),并综合逐层空间注意力模块(LSAM)和全局上下文注意力模块(GCSA)设计多注意力特征融合结构。输入经骨干网提取初步特征后输入各注意力模块提取通道特征、空间特征及全局上下文特征,得到骨架点定位关键信息。然后,采用简单有效的融合策略对多角度特征进行融合,综合所有信息提高算法推理能力和鲁棒性。(3)在MPII和COCO标准数据集上的结果证明了本文所提算法的优越性。该论文有图36幅,表18个,参考文献91篇。
其他文献
铁谱分析技术是油液分析技术的重要手段,其原理是通过提取设备运转过程中产生的磨损颗粒特征信息对设备的磨损状态进行判别。但目前存在人工铁谱分析效率低下且存在主观性误差、铁谱图像处理只能提取磨粒二维特征信息等局限。为此,本文基于图像处理及三维重建技术,探索一种铁谱磨粒显微图像识别及表面形貌重构方法,提高铁谱分析的自动化程度及准确率,减少铁谱分析漏判、误判等情况。在探究机械设备零部件表面的磨损机理,归纳机
学位
随着人口老龄化的加剧、人们对生活便利性要求的提高,以及新冠疫情影响的扩大,基于社区的药品取送服务已经开始实行,但是,至今没有完善的服务体系。为显著提高取送员的工作效率,向更多人群提供同步服务,取-送药路径规划成为提升工作效率的关键问题。然而,取药处药品存量的不确定性和城市道路的复杂性,给取送员的取-送药路径规划带来了困难。基于此,针对售药机构多样、取药需求差异的取药路径规划问题,论文给出一种小生境
学位
学位
随着我国煤炭资源逐渐趋向于深部复杂区域开采,冲击矿压灾害逐渐发展成为影响煤矿开采的煤岩动力灾害之一。冲击矿压的主控因素之一是煤系地层的沉积微相属性,包含有煤层厚度特征,煤岩层物理力学性质及地层沉积结构等。论文以地层沉积微相为切入点,采用数理统计、理论分析、数值模拟、工程实践等研究方法,对“高家堡煤矿地层沉积微相对冲击矿压的控制作用”进行分析与研究,以此对矿井冲击危险区域进行分析与判别,达到对冲击矿
学位
在过去的几十年里,化石能源枯竭的速度不断加快,解决能源问题已成为全人类的当务之急。新的储能方式以及储能材料的研发是解决该类能源问题的关键。近年来,超级电容器因具有出色的功率密度、优秀的循环和倍率性等特点,在大功率器件、混合动力汽车等领域都有了长足的应用,为解决能源的存储问题提供了一种值得研究的方案。但超级电容器能量密度较低等问题,成为制约其发展的瓶颈。近年来,二维过渡金属碳化物/氮化物(MXene
学位
随着我国高速公路建设突飞猛进的发展以及高速公路周边设施的进一步完善,研究不同高速公路广告设施的安全风险评价就显得尤为重要。围绕项目《X高速公路(Y段)沿线广告设施的安全评价》展开,对高速公路的广告设施的距离、大小及范围进行深入安全风险研究,有助于项目广告设施审批、建设以及后续相关工程的开展。本论文主要研究建设在X高速公路Y段两侧的广告牌,分析讨论影响驾驶行为安全风险的影响因素,建立多层次、多维度、
学位
数字接收机凭借其灵敏度高、动态范围广以及易于硬件实施的特点,在无线通信领域中得到广泛的应用。但随着5G的商业化普及,移动数据流量也随之迅猛增长,导致数字接收机接收端信号采集和后端数据处理均面临着巨大压力。压缩感知(Compressed Sensing,CS)理论利用通信系统中信号的稀疏特性,仅需采集少量的数据,即可恢复出信号的全部信息,为数字接收机海量信息的接收与处理提供新途径。因此在通信系统中,
学位
堆垛机器人作为木门制造行业中最为关键的堆垛设备之一,其工作性能直接影响木门制造效率和自动化程度。木门产品定制化和多样化对堆垛机器人末端定位精度提出更高的要求,而末端轨迹精确跟踪可以有效提高定位的精度,避免搬运堆垛时损坏。基于此,本文在简化高速重载堆垛机器人基础上,采用理论仿真和试验验证相结合的方法,开展堆垛机器人末端轨迹跟踪控制研究,以期实现堆垛机器人末端轨迹高精度控制。根据高速重载机器人的结构和
学位
目前,煤基沥青用于配煤,采用无回收焦炉生产铸造焦已经成为现实,而市场上的煤基沥青种类很多,选择何种沥青用于配煤可以生产质量更好的焦炭的问题仍不明确。因此,本论文针对不同来源的煤沥青,比较其各项指标对整体配煤原料特性和其所形成焦炭质量的影响,通过研究揭示煤沥青评价指标与焦炭质量指标之间的关系和规律,为铸造焦生产中煤基沥青的选择提供理论参考。以山西某焦化厂炼焦配比为基础,选用8种不同的煤基沥青作为配煤
学位
穿刺手术机器人是一种典型的微创外科手术机器人,其主要作用是作为一种辅助工具来拓展医生的手术能力。穿刺手术机器人的控制通常采用主从遥操作控制方式,医生操作主手设备进行手术动作,动作信息经过计算机进行数据处理后发送给机器人,然后由其按照医生意图操控穿刺针实施手术,而主从遥操作控制的核心在于遥操作控制系统的设计。现阶段机器人辅助穿刺手术基本采用硬质材料的钢性针,穿刺过程中钢针需要对软组织施加较大的穿刺力
学位