基于注意力-残差全卷积神经网络的图像超像素分割算法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:fan20090603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
超像素方法是图像分割的常用方法之一,基于梯度和图像密度的超像素分割方法可以将图像进行更为简练的筛选和分层表示,以此降低后期工作处理的图像单元个数。但其难以做到可微,因此难以将超像素方法作为一个模块插入到原始的卷积神经网络中进行训练和使用。基于超像素采样的方法和基于全卷积的超像素分割方法是将标准的卷积操作在规则的网格上定义,尝试将超像素算法纳入深度神经网络。但当这种方法应用于超像素时,效率就会降低。同时,作为提高深度学习性能的模块,注意力机制和残差机制正在被广泛使用。基于通道的注意力模块可以更好的得到不同的特征权重,基于空间的注意力模块可以对三维图像进行特征的进一步提取,基于通道与空间相结合的双重注意力模块可以对三维图像的多维特征进行更好的特征权重表示。基于广义的两层残差连接可以显著地提高深度神经网络的性能。通过对残差结构在复杂度和深度上的优化,可以有效的提升其获取信息的能力。基于覆盖数的残差结构,可以得到基于边际的多类泛化边界,保证其泛化是直接的。本文使用一种将超像素分割思想同可训练的卷积神经网络搭配使用的方法,将超像素机制插入到后续的卷积神经网络中,提高了自然图像和胰腺图像的分割性能。本文所做的工作有:(1)本文提出了一种基于挤压和激发(SE)的卷积神经网络进行超像素分割,该模型解决了超像素分割过程中因特征图的不同通道而造成的损失问题。带有SE模块的卷积神经网络可以准确地分割图像。本方法选取标准数据集BSDS500以及NYUv2进行相关实验,BSDS500包含200张训练图、100张验证图和200张测试图。NYUv2是一个RGB-D数据集,包含1449张图像和物体实例标签。实验表明,模型在两个不同的数据集上均得到优越的平均ASA、BR-BP、CO。通过与目前的超像素分割方法进行比较,展现了所提方法的高分割精度和速度。(2)本文通过对SENet架构的进一步改进,引入残差机制,得到SE-Res Superpixel网络,用以对图像进行分割。在每次卷积过程中加入残差机制,利用快捷连接显著降低了训练难度,在训练和泛化误差方面都有很大的提高。本方法选取NIH-CT-82数据集进行相关实验,该数据集向公众开放,包含82张腹部对比度增强的CT扫描图像。通过实验,本方法得到优越的Dice、Acc、Precision、Recall、F1 score。另外,对改进后的SE-Res Superpixel网络进行自然图像的分割实验,用以验证加入残差机制后的网络对自然图像分割的提升效果。数据集仍然选用BSDS500和NYUv2两个标准数据集。两个数据集的平均ASA、BR-BP、CO可以得到一定的提高,展现了所提方法的高分割精度和速度。
其他文献
2017年,教育部颁布《普通高中通用技术课程标准(2017年版)》,随后国内四个出版社的通用技术教材陆续开展修订,修订版的教材迅速进入各省市的高中通用技术课堂。STEAM教育反映了当今教学形式的发展方向,即系统性、实践性、多元性、开放性;同时也体现当前教育的主流,以学生为主体,注重对学生核心素养的培养,注重知识和实践结合的教育形式,注重学生亲临体验的开放性学习设计。因此,本论文从STEAM的角度对
学位
Ad Hoc网络(无线自组织网络)是由一些具备通信能力的节点组成,不需要固定基础设备的支持。节点的随机移动使得Ad Hoc网络拓扑的变化难以预测,会导致网络性能下降。为了优化Ad Hoc网络问题,一些基于自然启发的群体智能行为的优化算法被提出并逐渐应用到Ad Hoc网络中。本文针对Ad Hoc网络中节点间的协作、无人机Ad Hoc网络路径优化以及Ad Hoc网络与异构网络之间最优网关的选择,这三个
学位
忆阻器是一种具有数据存储功能的半导体器件,在同一个器件上,可以实现多级存储和逻辑运算,为打破传统冯·诺依曼架构并实现神经形态计算打下了基础,其应用前景不可估量。同时,相比于MOSFET等有源器件,无源忆阻器具有尺寸小、结构简单、均匀性和重复性好等优势,在神经形态计算、图像处理等人工智能领域有着重要的作用,引起了科研工作者的极大研究兴趣。传统三维铁电材料忆阻器的存储机制主要归功于材料内部在电场作用下
学位
糖尿病视网膜病变(Diabetic Retinopathy,DR)是一种常见的眼部疾病,对DR患者来说早期的诊断与治疗非常重要。在临床诊断中,眼科医生通常根据眼底相机拍摄的眼底图像来对DR进行分类。整个过程完全取决于医生的经验,既费时又费力。随着大数据和深度学习的发展,计算机辅助医疗诊断成为研究的热点,但是对于医学图像来说数据的获取往往是有限的。面对这一问题,本研究以眼底图像为主要研究对象,着力探
学位
随着物联网、人工智能和第五代移动通信技术等新兴技术的发展,人们对高速大容量通信系统的需求呈爆炸式增长。尽管通过波分复用和偏分复用技术以及多种调制方式的应用,在容量方面有了显著的改进,但指数级增长的数据需求仍缺乏足够的带宽。涡旋光束的不同轨道角动量(Orbital Angular Momentum,OAM)模式间相互正交,可以看作一个新的自由度,通过将不同模式的轨道角动量作为表示多进制的数据符号或多
学位
光纤作为光纤激光器最重要的组成部分,由于具有良好的柔绕性,可以使光纤激光器设计得灵活和小巧,从而易于系统集成、性价比高等。并且,光纤激光器在材料加工、通讯、医疗、军工等领域都有着非常广泛的应用。此外,掺镱(Yb3+)、掺铒(Er3+)和掺铥(Tm3+)等稀土掺杂光纤的研究与发展极大地促进了光纤激光器领域的发展。其次,在光纤通信应用领域,由于稀土掺杂介质在光纤中能够引起增益机制从而实现光放大,使光纤
学位
3D技术与现代生活息息相关,变得越来越流行,它可以为用户提供任何视点和角度的交互式以及沉浸式的视觉体验,因此,高质量的3D视觉体验成为人们现代生活中不可或缺的重要部分。而深度图像作为3D内容的关键组成部分之一,在许多计算机视觉任务中起着非常重要的作用,例如自动驾驶、虚拟现实、3D建模等,它反映了深度图像采集设备与真实场景的距离信息。传统的彩色相机可以轻易的捕获纹理丰富的高分辨率(High Reso
学位
细菌与人类的生产生活密切相关,在生态环境中发挥着至关重要的作用。但其中存在着大量的致病细菌,不仅会导致严重的细菌污染问题,危害人类的健康,甚至会导致人类死亡。如今,随着食品工业化的进一步发展,致病细菌引起的问题会大规模爆发,对食品安全和公共卫生健康造成巨大的威胁。因此早期地检测对于预防致病细菌引起的疾病以及防范重大环境公共卫生安全风险至关重要。数字微流控技术是近些年来发展起来的一种控制离散的液滴在
学位
随着信息技术的发展,可逆信息隐藏(Reversible Information Hiding,RDH)技术应用越来越广泛,医学、军事等领域都有着它的身影。近年来网络发展迅速,信息交互加快,如何在信息交流过程中,保证图像的低失真度,提高图像的保密程度这一课题,是当前RDH研究的重要方向。目前RDH已经在图像保密、原始图像的低失真等方面有了一定的研究。本文首先针对RDH当前数据嵌入容量低的问题,着重分
学位
由于互联网技术的飞速发展,数字图像相比于从前变得更加容易获取,更加容易传输,并且其在多种领域都有涉及。在此种情况下,不管是从商业机密,还是医疗信息又或者是个人隐私来说,对数字图像安全性的保护变得极其重要。其中感知加密算法是一种有效的方法,它可以只加密部分有用的信息来防止多媒体视觉内容的泄露,同时又减少了加/解密的开销。正因为这些优点,如何对感知加密图像的安全性评价变得非常重要。传统的安全性分析方法
学位