【摘 要】
:
姿态估计与语义分割是计算机视觉中的两大主流任务,人体姿态估计是精确定位人体关节点的位置,而人体解析属于语义分割中的一个子任务,具体任务是对图片中的人物进行像素级识
论文部分内容阅读
姿态估计与语义分割是计算机视觉中的两大主流任务,人体姿态估计是精确定位人体关节点的位置,而人体解析属于语义分割中的一个子任务,具体任务是对图片中的人物进行像素级识别,进而对人体的每一部分进行分类。近年来随着深度学习技术的飞速发展,这两项任务也越来越受人们关注,并广泛应用在我们生活中的诸多领域,例如行人重识别、视频监控等等。虽然是从不同的角度分析人体,但是这两个任务却是高度相关、相互协助促进的,一方面细粒度的语义信息可以更好地促进关键点的定位,另一方面精确定位的关键点又可以反过来帮助语义信息更好地分类。挤压与激励(SE)模块近年来在深度学习中被广泛应用。本文提出了改进的SE模块与新的提纯模块来促进姿态估计与人体解析的联合学习方法。其中第一种改进的SE模块采用行人重识别方法任务中的拼接SE模块,该SE模块和传统的SE模块不同之处在于将两个输入特征经过全局池化后拼接在一起,能够充分地融合两者的特征信息;第二种改进的SE模块是将传统SE模块的加权参数交换,在我们的任务中将姿态估计部分所学的的权重赋予人体解析部分,反之将人体解析部分的权重赋予姿态估计部分,使得二者任务互相促进,从而提高精度;最后我们将MULA中的自适应模块换用空洞卷积形式,从而感知更多的图像信息。
其他文献
近年来,随着我国工业的飞速的发展,对智能体的要求也变得越来越高。智能体可以为一个飞行器、一个卫星、一个带有微处理器的传感器等等。如今,单个智能体显然已经无法满足日渐复杂的控制需求。多个相对简单智能体的协作控制,概括而言,就是将单个复杂的智能体转换为多个简单的智能体的协作控制,使用团体协作的方式来完成复杂的控制任务。多个简单智能体的协作控制,符合现阶段科技技术发展的趋势。本文研究了由一般线性化智能体
随着互联网和智能终端的爆发式发展,巨大的社交网络群体和组织产生了海量网络信息,如何在非结构化的网络信息中捕捉分析民众的情感走向和发展,是一项重要的研究课题。中文文本数据相对于英文文本数据来说具有不同的表达形式,存在语法特殊性、语义多元、隐寓表达等诸多特点,除此之外当前大部分的中文文本情感分类方法属于比较浅层的学习方法,分类结果的准确性依赖于人工抽取的样本特征,且文本表达能力有限,随着数据量的增大和
在过去的几十年间,光纤光学技术可谓是取得了突飞猛进的发展,作为分支之一的光纤传感器由于有着高灵敏度、质轻体小、不受电磁干扰等优点,在国防科技、环境保护、医疗检测等领域倍受关注。科技的发展离不开创新意识,只有不断地对新技术提出挑战才能实现技术的进步。在光纤传感领域,如何提高传感性能以及设计出新型的结构是一个经久不衰的话题,本论文在汲取前人研究经验的基础上,提出了以少模微纳光纤为传感结构的高性能干涉型
室内混响是声音从声源发出后由于不断被室内表面反射、吸收而逐渐衰减的现象。如果混响过大,会使声音变得浑浊和杂乱,需要使用去混响技术,例如,在免提通信系统中使用去混响提
本文以晚清画论家、书画家秦祖永及其品评著作《桐阴论画》为中心,对其绘画品评特征和鉴赏观进行研究。笔者结合传统绘画品评理论,从其画学著作和绘画风格两个方面入手,分析
御宅文化缘起于日本,其群体范围随着网络信息技术的进步和社会经济的发展而不断扩大,由最初的动画、漫画、游戏爱好者变为了各个虚拟领域的爱好者,在日本渐具规模。传入中国
党的十九大报告指出:“农业农村农民问题是关系国计民生的根本性问题,必须始终把解决好‘三农’问题作为全党工作重中之重”,并提出产业兴旺、生态宜居、乡风文明、治理有效、生活富裕的总要求,坚持农业农村优先发展,加快推进农业农村现代化。~((1))当前,农村土地存在的问题主要有农民土地财产性收入实现不充分、土地增值收益用于“三农”不足、建设用地安排“重城轻乡”等方面,为破解这些问题,就需要对农村土地要素市
窄带物联网(NB-Io T)作为物联网的一个重要分支,能够加强覆盖、降低用户设备(UE)实现复杂度,同时允许运营商仅使用现有的小部分频谱进行布网,十分便利。然而NB-Io T在带来优
协调有序的市场秩序,健康发展的国民经济和高品质的百姓生活都离不开科学合理的市场监管体系。十八届三中全会提出改革市场监管体系,实行统一的市场监管;十九届三中全会要求改革和理顺市场监管体制,整合监管职能,加强监管协同,形成市场监管合力;2018年国家市场监管总局的设立。这一系列改革措施都有利于形成一个让市场主体公平竞争的市场氛围,创建让消费者放心的市场机制,对于提高国家治理能力的现代化也有重要的意义。
随着手机等移动终端对计算机视觉需求的不断增加,如何高效编码视觉信号成为人们关注的焦点。作为一种编码视觉信号的模型,视网膜编码模型以模拟视网膜神经节细胞特性为目标,利用非线性计算将视觉刺激编码成一系列尖峰放电序列。虽然现存多种视网膜编码模型,但现有模型存在简单模型拟合效果差、复杂模型计算量大的问题。为解决上述问题,本文展开轻量化视网膜编码模型研究。本文主要内容如下:(1)首先,针对Spike-tri