自顶向下的多人人体姿态估计算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lewllen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态估计算法是计算机视觉领域的一个基础性研究。它是行为识别、人物追踪等其他计算机视觉研究的基础。人体姿态估计可以分为单人任务和多人任务。在现实的应用场景里摄像头获得的照片或者视频中往往不止包括一个人,多人的人体姿态估计算法更能满足实际应用的需求。多人人体姿态估计任务中,图片中人体之间存在的重叠或者干扰是任务复杂性的主要来源。如何正确地检测图片中所有人体的姿态是一个极具挑战性的课题。在目前的多人人体姿态估计算法研究中,主要存在自底向上和自顶向下两个大类的算法。自底向上的方法首先检测图片中所有人体的关键点,然后对这些关键点进行聚类以形成不同的个体姿态。自顶向下的方法则首先检测人体,然后根据人体候选区域从图片中将人裁剪下来,再针对裁剪下来的图片做单人的人体姿态估计。本文主要研究基于深度学习的自顶向下的多人人体姿态估计算法,并且主要关注于其中的单人人体姿态估计部分。当图片中存在非常靠近的多个人体时,根据目标检测算法获得的人体候选区域裁剪出来的图片中很容易存在其他人体的相同局部关键点造成混淆。关键点的局部信息区分性较弱。因此需要通过全局信息来辅助分辨局部区域。本文引入非局部模块来使神经网络在浅层就可以获得全局感受野,更好地捕获全局信息。为了使网络能够高效地提取特征,本文引入双注意力模块,使得模型能够聚焦于与多人人体姿态估计任务相关性大的特征,获取更多所需要关注的目标的细节信息,抑制与当前任务无关的信息。人体具有一定的肢体结构,不同关键点之间的相关性不一样。相关性强的关键点之间可以为彼此的检测定位提供有效信息,而相关性弱的关键点之间则很可能存在相互干扰。本文通过基于人体肢体结构的特定特征学习来有效地建模关键点之间的相互关系。本文通过在COCO和MPII数据集上的实验,充分验证了本文改进方法的有效性和正确性。在COCO测试集上,本文改进后的方法平均精度达到74.0,与基准模型相比精度提升了2.5。
其他文献
随着现代科学技术的飞速发展,国际间的电子商务的活动也日益频繁,业务整合是发展的关键,而翻译成为商务交流中不可或缺的一环。此类文件的主要职能是传达思想。这一文本的语
目的:高血压是临床上最常见的心血管疾病之一,因此越来越多的手术患者并存有高血压。即使患者术前血压控制良好,但是由于患者对手术的恐惧、入室后的精神高度紧张因素造成的血流动力学波动,导致心脑血管意外也有发生,因此麻醉医生保证患者血流动力学的稳定十分重要。右美托咪定(DEX)属于新型的麻醉辅助用药,由于独特的药理体特性已经被广泛应用到高血压患者的临床麻醉中,但是现在的许多国内外研究对术前预给DEX对高血
随着全球能源和环境问题日益严重,煤、石油、天然气等化石燃料逐渐消耗,对于新能源的开发利用已经成为急需展开研究的方向。生物质能具有资源丰富、分布广泛、低碳、清洁可再生、利用技术多样的特点,因此受到了研究者们的广泛关注。本文主要依托国家科技支撑计划——生物燃气产业模式研究与利用示范(2015BAD21B05)。以农林生物质等难降解的生物质废弃物为对象,针对目前农林生物质气化中燃气热值低、燃气含有较高杂
随着我国经济的高速发展,能源的消耗量日益增加,在不久的将来,最紧迫的问题之一是跟上不断增长的能源需求,同时避免过度的环境退化。将太阳能与生物质资源进行耦合利用以取代传统化石能源,可缓解我国能源结构不合理、能耗高、污染重等问题。但目前对于这一过程的具体反应机理及诸如熔融盐等添加剂对与热解反应途径的影响仍有待进一步探究。本文针对500-700℃下LiNaK的三元共晶碳酸盐对生物质热解反应途径和动力学机
随着国民经济的发展及环境恶化,开发新型能源已经成为迫切需求。太阳能作为一种新型能源,具有资源丰富、无污染等优点。在我国北方采暖地区,城市主要采用集中采暖方式,而农村地区绝大多数是采用以煤、天然气等燃料的分散自供暖方式,在污染空气的同时经济性也较差。采用太阳能集热器将太阳能转化为热能作为建筑采暖热源的方式既环保又经济。本文对太阳能微小通道集热器的性能进行了研究与优化。首先建立了该装置的数学和物理模型
在深度学习中,GPU通常用于加速深度神经网络的训练过程,然而GPU有限的物理内存意味着它很难训练大规模的深度神经网络模型。现有的内存优化方法包括重新计算方法和CPU-GPU迁移方法,它们对神经网络中的所有层应用单一的优化方式,不能实现理想的训练性能,忽视了神经网络中不同层的数据迁移成本和计算成本不一致的重要特征。针对现有优化方法的不足,提出一种基于层的内存复用和优化方法——Layup,包含两个策略
互联网的飞速发展使网络信息数量呈现出指数增长的趋势,这一现象为用户带来海量信息的同时也造成了信息过载问题,用户在面对大量信息时难以从中获取感兴趣的高质量信息。针对
背景:近年来大量的研究结果提示真正的致病性遗传变异多位于基因调控元件中,如增强子和启动子。随着三维基因组学的发展,研究者们发现增强子与其靶基因启动子的交互作用通常在一个高度有序折叠的基因组单元即拓扑关联结构域(topologically associating domains,TADs)内进行,并且相邻该区域的边界富集了许多转录因子CTCF的结合。TAD边界的干扰被证实可以影响染色质折叠成环,扰乱
近年来,随着科技的进步和人工智能的快速发展,人们对大脑产生的生理信号中的脑电信号情感识别有了越来越多都研究。脑电信号是由人的中枢神经系统产生的一种生理信号,人的情
对特定类型神经元的活动进行时间精确、无创和远程的控制是神经科学长期追求的目标。光遗传学技术能够在毫秒量级的时间内准确控制遗传学上靶定的神经元活性。然而目前常用的光遗传技术:基于植入光纤的方法会对实验对象的组织及行为造成损害,并且很难用于外周神经元的光刺激;基于红光的方法不能穿透深部组织;基于上转换纳米材料和近红外光遗传方法(上转换光遗传)受限于近红外光被生物组织中水大量吸收导致的低发光效率和过热现