基于远距离空间关系的人体姿态估计算法

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:Play_pig
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体姿态估计是计算机视觉领域一项极具挑战性的任务。姿态估计任务估计一幅画面中各身体部分的位置,这些身体部分具有特征多样性高、易存在遮挡、空间关联性高等特点,传统姿态估计方法缺乏足够的特征多样性和全局综合能力,难以很好地应对此类问题。随着深度学习的发展,姿态估计模型极大地受益于卷积神经网络框架,在近年来取得了令人瞩目的进步。姿态估计任务常常伴随着较大的空间关联性。身体关键点的分辨需要来自身体其他部位的信息提供支持,左右的辨别需要面部和手腕等部分的朝向确定,人物关键点的分组更需要其他关键点的位置信息。为了建模这种长距离的空间关联性,新的姿态估计模型使用越来越深的网络以构建更大的感受野。尽管此类网络能够在深层获得较大的感受野,网络浅层仅仅能从小范围的区域提取特征。部分关键点的提取只需要少量额外的远距离信息,如果能够使其提前获取远距离特征而不必等待至深层网络,这些关键点的提取可以被大大提前,网络深层的感受野也能更大,因而网络将具有更强的全局综合能力。本文尝试探索两种扩张网络浅层感受野的方式,并分析它们对姿态估计任务的影响。本文首先提出了一个长距离关系模块,其中包含具有固定偏移量的特征偏移过程。接着本文提出了另一种具有可学习偏移量的特征偏移模块,以及其中的相关性关注机制。本文的主要贡献如下:1.提出了一种包含固定偏移量的特征偏移模块,这种模块可以被视作扩张卷积的一种近似,被称作跨通道扩张卷积。本文尝试解释了为什么跨通道扩张卷积相比普通扩张卷积在具有极少参数的情况下不会更差,并通过实验证明了该猜想。实验也表明了特征偏移模块确实能使网络有更好的性能,并展示了其步长对性能的影响。2.本文进一步提出了包含可学习偏移量的特征偏移模块,这一模块还额外包含了相关性关注机制。本文解释了这一模块可以被视作一种具有动态感受野形状的卷积操作,并用实验说明这一模块可以在更小的网络结构下达到更好的效果。本文还分析了这一模块对哪些关键点的检测作出了贡献。
其他文献
目的本课题拟通过体内、体外实验证实松果菊苷抗乳腺肿瘤的能力,并探究其可能的作用机制。方法首先,通过采用MTT试验,克隆形成试验,划痕试验,侵袭以及迁移试验,以不同浓度的
在建筑信息模型(building information modeling,BIM)的应用中,需要显示大规模、大体量的三维模型。当这些三维模型显示在专业的图形工作站上时,它们经常会由于计算机的内存不足出现卡顿、闪烁等问题。并且,在铁路建筑工地上所能够使用BIM应用程序的环境较差,很难为用户配备专业的设备。这需要图形显示设备能够平稳地支持大型3D模型在配置较小的设备上甚至在移动设备上的显示。用来满足
背景原发性肝细胞癌(HCC)是最常见的恶性肿瘤之一。目前,肝癌的分子机制尚不清楚。环状RNA(或circ RNA)是一种单链RNA,与众所周知的线性RNA不同,它形成共价闭合的连续环,即在
企业管理者在年龄、性别、教育等方面不同的背景特征造就了他们各不相同的性格和处事方式,从而导致了其在财务决策方面的差异,最终将会对企业的融资效率产生影响。本文基于中国A股上市公司2009—2018年的7056条数据,通过中介效应模型和调节效应模型实证分析了董事长的背景特征对企业融资效率的影响机制。研究表明,A股上市公司董事长性别、年龄、海外背景和学术背景都对企业的融资效率产生了显著的影响,并且董事长
随着近年来掀起的以比特币为首的数字货币浪潮,人们对于“区块链”这种分布式系统的健壮性提出了更高的要求。如何在敌手参与的情况下,解决分布式系统的一致性问题,设计出安
背景:胰腺癌是预后最差的恶性肿瘤之一。胰腺癌之中最常发生的分子事件是KRas的突变。Calpains是一类Ca 2+依赖的半胱氨酸蛋白酶,和多种肿瘤的发生发展关系密切,其中包括胰腺
随着爆破技术的广泛应用,爆破地震问题作为工程爆破负面效应的主要问题,受到普遍的关注和重视。砌体结构建筑在我国建筑中的比例相当大,其抗震性能和结构整体性与其它结构相比较差。因此,本文采用理论分析、现场试验和动力有限元模拟等研究手段,对爆破地震波传播特性及爆破地震波作用下砌体结构的动力响应和损伤开裂演化规律进行了系统的探讨。主要的研究成果如下:(1)基于柱状地震波传播理论,建立爆破地震波的振动速度与爆
结构异构体在化学领域尤其是材料化学领域占有着重要地位。相同特征基团在空间位置上的不同决定了异构体性质上较大的差异。我们通过"一锅法"合成了含芘(刚性稠环)、咪唑(不
出水流道是连接水泵导叶出口与出水池的衔接通道,其作用是使水流在从水泵导叶出口流入出水池的过程中更好的转向和扩散,在不发生脱流或旋涡的条件下最大限度地回收动能。对于大型低扬程泵站,出水流道的水力损失在水泵总扬程中所占的比例大,设计不佳可导致流道内部流态紊乱水力损失大,泵装置性能低,影响泵站整体效益。采用数值模拟和模型实验两者结合的研究方法对直管式出水流道内水流的流动规律进行研究。通过数值模拟,在出水
由于其在行为分析、动作识别以及复杂场景理解中的广泛应用,围绕人体姿态的相关研究是近几年计算机视觉研究的热点。其研究对象也从图像中的单人姿态,推进到视频中的多人姿态