基于超像素分割和图神经网络的图像语义分割研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:goodcat13579
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人工智能涉及到生活方方面面的今天,对于人工智能相关问题的研究日益增多,其中有一些问题利用深度学习的方法进行解决。例如计算机视觉问题,自然语言处理问题等等,其中对人类生活影响巨大的则是计算机视觉相关技术的应用。从人脸识别的门禁系统的使用,到无人自助式地铁售票的应用,再到无人驾驶、城市大脑等改变人们出行方式的新技术的出现。人工智能中的深度学习研究给人类生活带来极大改变。尽管当前很多研究者在进行深度学习中的计算机视觉的问题相关的研究工作。计算机视觉这一领域依然有很多问题亟待解决。本文的研究工作是集中在计算机视觉领域中的一个基础问题,具体来说是图像分割任务方向。图像分割任务主要分为语义分割、实例分割和全景分割等三个研究方向。本文研究的是图像语义分割方向的问题。由于本文作者在平常的学习中观察到图像语义分割方向已有算法中仍然存在如下两个问题:一、分割结果中的边缘信息不能得到很好的保留。二、分割结果中仍然存在有一些分割不准确的噪音点。针对这两个问题,本文开展了一些文献调研,理论分析以及相关的实验工作,并且提出了一种基于超像素分割算法和图神经网络模型的新的图像语义分割网络模型。本文提出的新图像语义分割网络架构主要包括以下五个部分,基础分割模块、超像素分割模块、特征信息提取模块、图神经网络正则项模块和解码器模块。其中基础分割模块主要是在deeplab v3算法的基础上进行的,而这个算法也可以更换成其他类似的基础分割网络。实验表明对于不同的分割网络,本文算法都是有效的。而超像素分割模块,本文主要采用的是简单线性迭代聚类算法模型,并加以实现的。对于特征信息提取模块,本文采用的是LAB颜色空间和卷积神经网络底层和顶层分别提取特征的方法来提取特征。关于图神经网络模块,本文将图注意力网络作为基础分割网络的正则项加以引入,并达到了一定的效果。解码器模块的设计是经过调研之后加入的,这一设计有效的保障了底层特征信息的保留。本文的算法流程是:图片先进入基础分割网络得到图片的初步分割结果,图片同时也进入超像素分割网络模型,得到超像素分割的结果作为分割网络模型的辅助信息,从而帮助图片建立图结构。继而,再通过特征信息提取模块,提取得到图结构的节点的特征信息。将图结构和图结构的节点特征信息等都输入图注意力网络模型中,使其进行补充运算。最后用解码器模块对于低阶信息加以恢复,得到最终结果。本文除了提出一个基于超像素分割和图神经网络的新的图像语义分割网络模型以外,还针对本文算法中的各种设计及超参数的设置等进行了一系列必要实验,来确定这些具体设计方案和超参数选择。并且给出了在Pascal Context数据集和Pascal VOC 2012数据集上的训练得到的算法效果数据和图片。本文算法在与类似思想的算法进行比较时存在一定的优势。
其他文献
阿尔兹海默症(Alzheimer’s disease,缩写AD)是一种全球范围内发生的神经变性疾病,年龄是最重要的危险因素。其患者通常表现为认知能力下降,严重者会丧失独立生活的能力。目前,
虽然现在网络越来越发达,带宽越来越宽裕,但是依然有很多人保留将电影动漫等视频下载下来看的习惯。自从有了iPad这个看片利器之后,谁还在开着电脑看电影看视频?本期这个系列专为习惯下载观看的同学准备。  RushPlayer  RushPlayer绝对是iOS上的影音播放神器。它提供清晰的画质,播放流畅度超过很多全能播放器。同时,RushPlayer还囊括了精选的国内外电台电视台资源,并且后台提供服务
本文采用溶胶-凝胶法,以异丙醇铝和五水硝酸锆为前驱体,制备Al2O3、ZrO2单组份溶胶和Al2O3-ZrO2复合溶胶,并通过高温热处理制得Al2O3-ZrO2复合膜。利用热重(TG-DTG)、傅里叶红
当今社会,厨卫间多采用成品通风道进行排风排烟,但粘贴在上面的瓷砖时间长了容易出现阳角开裂甚至脱落的现象。究其原因,除了施工工艺和通风道、瓷砖等材料本身质量的问题外,
结合工程设计实践,该文简要总结剧院在空调冷热源、空调水系统、空调风系统、消防防排烟方面的设计方法;重点提出剧院和电影院大空间空气调节系统的设计、控制,以及金属外壳
介绍了基于策略的网络管理和QoS的相关概念之后,针对网络的QoS管理,提出了基于策略的网管系统的体系结构.通过实验明显地看到在管理网络QoS时,采用基于策略的管理系统的网络
软件质量是软件开发相关各方共同关注的目标,定量评价软件质量是软件领域的难题.提出了运用灰色理论对软件质量模型的各要素进行灰色关联分析的技术方法和实例过程.结果表明,
现行混凝土结构设计规范第11.4.15条对抗震结构柱箍筋加密区内的箍筋肢距作了如下规定:"一级抗震等级不宜大于200mm;二、三级抗震等级不宜大于250mm和20倍箍筋直径中的较小者;
<正>0引言当下,人与人之间信息交互和传递的主要渠道就是网络,所以网络安全也成为了越来越多人所关注的话题。网络信息安全如果存在隐患,轻则造成个人信息的泄露,重则造成巨
期刊
115是一个非常有名的网络硬盘,很多用户都通过它来分享文件,但是在下载115的过程中遇到文件过期或被删除的情况,就无法下载自己喜欢的网络资源。有没有什么方法可以下载已经过期