面向语义分割的注意力机制与多尺度特征跨层融合研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:zhuangjun_1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,深度学习的发展日新月异,随着全球的科学家和学者们的不断努力,在我们现实生活中已经有越来越多的深度学习项目可以落地并应用到我们生活中。而本论文所研究的语义分割其实严格来算也是一种密集的分类任务。其相当于把图片中每一个像素都进行分类,并最终打上掩码以在宏观上表示具体某类像素集合的类别。而如今语义分割已经被大量地应用到无人驾驶、遥感图像、医学图像等领域当中。但随着语义分割大量被应用,也逐渐在真实场景中浮现出各种问题。如网络无法很好地学习具有复杂特征的物体,导致对复杂物体的分割效果欠佳和网络对于多尺度信息的不敏感导致对不同大小物体的分割效果欠佳等。本文认为解决这两个问题对推进语义分割在实际场景的落地是具有十分重要的意义的。首先,本文从注意力机制入手,通过设计符合场景需求的注意力模块来提高网络对拥有复杂特征的物体的学习能力,其次利用多尺度特征融合结构增强网络对不同尺度物体的识别能力。为了证实方法的有效性,本文将从医学图像分割和街景图像分割两个场景入手,分别设计对应的网络结构。因此本论文研究的重点方向大致分为两点:(1)为了提高网络对复杂物体特征的敏感度,本文在不同的场景中结合了注意力机制,并提出了多输入的注意力模块(MCAM)。该模块尝试用包含了抽象语义信息的高层特征为指南,对网络中包含空间细节性信息的底层特征进行筛选,从而达到抑制无效的空间细节性特征和强调有效的空间细节性特征的目的。在宏观上,这有利于网络识别具有复杂特征的物体。(2)为了增强网络在分割尺度大小不一的物体上的分割能力,本文从跨层融合多尺度信息这方面入手,研究如何融合不同尺度的信息会对识别不同尺度的问题产生符合预期的效果。并对不同的网络结构继续消融实验。并且本文认为针对不同的场景,不应笼统地使用一致的网络,而是应该针对场景的难点进行分析,从而设计不同的网络结构。因此,本文在代表医学图像的食道肿瘤数据集和著名街景数据集Cityspaces上分别设计网络结构,并做了不同的实验。通过实验展示出的结果,发现在具有复杂特征的食道肿瘤数据集中,通道注意力机制的确能很好地提高网络的分割效果,并且结合多层融合不同尺寸的模块后,能进一步地提高性能。而在街景数据集Cityspaces中,通过实验结果,也可以看出融合多尺度特征的网络对提高模型的分割结果是具有明显的有效性的。
其他文献
短期电力负荷预测(Short-term load forecasting,STLF)在电力系统的自动化控制、电力安全、市场运营、调度方案优化等方面发挥着重要作用,其预测范围一般为提前1天~1周。由于电力负荷序列本身的非线性、非平稳等特征以及各种影响因素对负荷的复杂影响,很难实现高精度的短期负荷预测。本文提出一种结合相似日选择(Similar Day Selection,SD)、变分模态分解(Var
随着互联网技术的高速发展以及互联网与人类生活融合的不断加深,网络在给人们带来各种便利的同时,人们所面临的网络安全问题也越来越多样:从盗取系统管理员密码、窃取私人信息与隐私,到攻击学校、政府、医院等单位服务、信息系统,破坏了系统机密性,完整性与可用性,造成社会巨大经济损失。因此网络入侵检测技术的研究也越发必要。随着深度学习理论的提出,深度学习算法在不同领域发挥着不可替代的作用,在入侵检测领域也发展迅
复杂网络主要是由若干个节点和节点之间关系所组成。在我们的现实世界中,各个领域的关系网络,包括数据、物理、生物学和电子计算机等都已经被抽象出来,形成许许多多的复杂网络。有研究结果表明,社区内部形成的网络结构在复杂的大型社交网络中普遍存在。社区发现作为目前主要研究复杂网络的关键技术和核心问题,可以通过检测各种复杂网络的潜在模型,实现进一步的应用研究,其中重叠社区是社区发现过程中的一个核心部分,对复杂网
在科技飞速发展的今天,智能、便捷已然成为时代的需求,智能车也因此而受到广泛关注。随着智能车技术的发展,智能车系统日趋复杂,对智能车和道路环境进行精确建模的难度越来越高,而传统的智能小车控制方法要求建立精确的数学模型,这给智能车的发展带来极大的挑战。与传统控制方法不同,强化学习无需知晓智能车系统的精确模型,通过交互试错的方式进行训练,在智能体与环境交互的过程中,不断学习控制策略,进而实现控制目标。本
在国家相关经济及购房限制等政策性调控之下,我国施工企业施工项目开发得到一定抑制,越来越紧张的市场竞争环境,使得许多施工企业竞争力有所下降。加上新冠疫情影响,国内经济受到较大冲击,这些变化使国内建筑公司处于更严峻的生存环境。为提升自身竞争力,建筑公司开始探索新的路径。能提升建筑公司竞争力的其中一条路径为采购管理,但当前我国建筑公司的采购管理现状并不乐观,存在一些问题亟待改善,只有设计和完善采购管理系
信息物理融合系统(Cyber-Physical systems,CPS)是工业物联网的基本组成部分,在“工业4.0”和“中国制造2025”中扮演着至关重要的角色。它通过使用传感器、计算机和网络技术,将信息系统和网络系统有效的整合起来。近年来,随着工业化和信息化的深度融合,CPS应用高速增长,但CPS的安全防护技术的研究较为缓慢,CPS的安全面临着严峻挑战。入侵检测是一种主动的防御技术,被广泛应用于
双足机器人因体型结构与人类高度相似更易融入人类社会,因此目前已成为了当前机器人领域最前沿的课题之一。双足机器人的稳定步行作为最基础的模仿人类的行为方式,具有非常广泛的应用前景,引起了国际众多学者以及高新技术企业的关注。但其具备自由度较高、机械结构复杂以及耦合性高的特点,双足机器人如何实现平滑及稳定的步行是所有足式机器人研究领域中的热点以及难点。机器人在行走过程中,步行稳定控制研究不仅能够帮助人类更
地址事件表示(Address Event Representation,AER)视觉传感器在采集视觉信号时仅检测像素的亮度变化,因而具有低功耗、低延迟和宽动态范围等优点,在机器人、自动驾驶、军事、航天等领域有着非常重要的应用价值。AER传感器输出的事件流具有稀疏性和异步性,传统基于图像帧的计算机视觉方法无法直接应用。对于AER数据的处理,需要研究专门的事件流数据表示方法和目标分类算法。在众多事件流
人体姿态估计是计算机视觉中一个重要的研究方向,根据输入的图片或视频文件,捕捉行人每个关节点的位置。姿态估计在生活娱乐、交通安全、安防监控方面扮演重要的角色。当前单人姿态估计取得了比较好的成果,但是多人姿态估计面临着许多的挑战。在复杂场景中,一是图片中同时存在尺寸过大和过小的行人,二是拥挤场景中行人之间的关节点相互遮挡,这两种场景中的姿态估计准确率有待提升。针对上述复杂环境中出现的多人姿态估计问题,
随着世界人口的增长和经济的快速发展,环境污染和能源短缺已成为两大难题。人们生活水平不断提高制冷需求也在不断上升,市场上基本都是采用电驱动压缩式制冷设备,而这类设备采用的氯氟烃类制冷剂会对臭氧层造成破坏,加剧温室效益,而吸收式制冷技术采用的是自然工质对,且具有运动部件少,结构简单等优势,近年来逐渐受到重视。我国是传统的农业大国,绿色生物质资源非常丰富,在农村地区秸秆类生物质由于没有好的利用途径,大多