基于卷积神经网络的道路场景语义分割研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:fenghuayi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割是一类利用图像中的高层语义特征对单个图像像素进行语义预测识别和语义分类的重要技术。随着现代人工智能科技不断的深入发展,在计算机视觉前沿领域的研究与实践中,图像语义分割已成为研究最基础的部分,在国内外诸多相关领域有着日益深厚的应用开发价值,如无人自主驾驶汽车、医疗影像分析、拍照摄影等。早期的图像分割方法分割性能较差,不能满足在复杂的城市道路场景中进行语义分割的需求。随着深度学习技术的不断发展,将传统的语义分割提升到了像素级别的语义分割,基于卷积神经网络的语义分割方法也逐渐替代了传统的语义分割方法,因此,基于卷积神经网络对图像语义进行像素级别的分割成为了当前的研究热门。图像语义分割在道路场景中的应用主要分为两种:一种是对道路场景中不同物体进行分割;另一种是更加精细地对某一类物体的不同目标进行实例分割。本文中所研究的道路场景语义分割问题是利用卷积神经网络作为基础实现对城市道路场景中不同类别物体的多重分割。卷积神经网络模型复杂,参数量大,容易受到其它噪声影响,进行道路场景语义分割具有一定的挑战性,因此,针对上述问题,本文的具体研究内容如下:(1)由于Fast-SCNN模型复杂,参数量大,在进行计算时速度有待提升,可能存在着一定的冗余信息,因此,有必要寻找一种有效的评估方法来判断参数的重要性,将一部分不重要的连接裁剪掉,以减少模型的冗余度,提高模型的推理速度,本文中提出在全局特征提取部分使用模型剪枝,对该部分进行微调,降低参数量和计算量,通过实验验证该方法是有效的,能够提高推理速度。同时感受野也是影响分割效果的原因之一,Fast-SCNN模型进行语义分割时存在同类别目标分割混乱以及不同类别目标难以区分的问题,因此引入多尺度特征信息融合,将不同尺寸的特征信息与高层语义特征信息进行融合,可以识别到更多浅层特征信息,增加网络的感受野大小,提高分割的精度。在Cityscapes数据集上进行了实验,验证了该方法的有效性。(2)Fast-SCNN网络在解码器部分进行图像信息还原时,由于网络结构和分割方法的问题,导致图像信息压缩过度,在图像信息还原过程中将会丢失很多特征信息,导致最后得到的分割效率不高,因此,在解码器部分采用扩张解码,利用三个扩张卷积密集连接到一起进行多尺度信息的获取,得到更为丰富详细的特征信息,有效地提升网络模型的分割精度。在Cityscapes数据集上进行实验,证明改进方法较原模型分割精度有一定提升。(3)在进行图像语义分割时,会受到来自其他噪声产生的干扰,在此过程中识别机制会关注到一些无用信息,导致一些有用特征信息的丢失,针对这一问题,本文引入使用两种不同的注意力机制,利用从通道以及空间得到的特征信息来增强该网络对目标细节信息的进一步关注以及学习,在一定程度上减少了其他噪声信息带来的干扰。能够在丰富的图像特征信息中关注到更多有用的细节信息。同时在Cityscapes数据集和ADE20K数据集上进行了实验,验证了该方法的有效性。
其他文献
随着计算机视觉和高性能传感器技术的发展,视觉里程计(Visual Odometry,VO)广泛用于机器人和自动驾驶等领域。单目视觉里程计是通过分析单目相机输入图像序列来确定相机位置及方向的过程,具有成本低、配置简单、计算效率高等优点。由于单目相机缺乏深度信息导致单目视觉里程计存在尺度模糊问题。深度神经网络(Deep Neural Networks,DNN)被广泛应用于计算机视觉任务中,因此研究基于
学位
随着信息技术的迅猛发展和广泛应用,大量的非结构化文本散布在互联网的每个角落。如何快速且准确地从海量的非结构化文本中提取出有用信息已成为自然语言处理领域的研究热点和难点。因此,本文主要围绕信息抽取任务中的实体关系抽取技术进行研究,旨在从非结构化文本中识别出实体和实体之间的语义关系。本文的主要研究工作和创新如下:1、针对现有实体关系抽取模型,在提取实体之前未充分利用实体信息和关系信息的问题,本文提出了
学位
钠快离子型导体(Na-superionic conductor,简称NASCION)结构的磷酸钒钠(Na3V2(PO4)3,简称NVP),不仅具有三维的钠离子传输通道和理论可逆比容量达117 m Ah g-1及其可在3.4 V(vs.Na+/Na)的电压平台下发生两个钠离子脱嵌,而且其结构稳定以及具有较好的循环性能。因此,在各种二次电池中受到了广泛的应用。本文使用第一性原理中DFT+U方法通过软件
学位
命名实体识别作为机器翻译、问答系统等领域的重要工具,在自然语言处理技术逐渐成熟的进程中占据重要地位。但是,由于命名实体识别任务中缺乏带注释的语料库数据,同时大规模的数据标注工作面临巨额成本,因此本课题主要基于半监督学习与深度学习相结合的方法,利用少量标注数据训练模型对实体进行识别和分类。本文从以下几个方面入手:第一,针对半监督学习实体标签识别率低的问题,研究半监督标签预测增强的方法。提出基于数据分
学位
在能源枯竭和环境污染问题日益严重的今天,可再生能源、储能与转换技术引起了人们的广泛关注。超级电容器(supercapacitor,SC)拥有快速充电、超长的循环寿命,能够弥补传统电容器与电池/燃料电池之间的功率/能量差距。电极材料作为超级电容器的重要组成部分,其结构设计和组分与电化学性能已密不可分,已经成为了近年的热门研究对象。而其中过渡金属硫/氮化物是一种很有前途的电极材料,其成本低、制备简单、
学位
近年来,基于U型架构的卷积神经网络模型在医疗图像分割领域中发展迅速,但由于该类模型结构简单,在特征处理上较为简易,以至于其分割精度还有较大的提升空间。因此,本文以多尺度策略为研究主线并基于U型架构展开研究,主要内容如下:(1)由于医学图像的特征形状多变,细节信息较多,从而导致模型在训练过程中难以有效的捕获细节特征信息。因此,本研究提出一种新的多尺度特征融合模型,其主要是将金字塔池化模块和等深度卷积
学位
<正>党的二十大报告把推动构建人类命运共同体作为中国式现代化的本质要求之一,以中国式现代化为桥梁和纽带,把中华民族伟大复兴与全人类的前途命运紧密连结起来。推动构建人类命运共同体,赋予了中国式现代化崇高的时代使命。一新时代十年,在习近平总书记的亲自擘画和亲力亲为下,
期刊
雾天场景下,因空气中的粒子对自然光的吸收和散射,致使设备拍摄的图像质量下降严重,不仅影响了视觉的观感,也给后续交通监控、军事侦查等技术的应用带来了阻碍。因此,对雾天场景下的图像进行去雾研究意义重大。本文完成的主要工作如下:针对暗通道先验去雾算法中存在的块效应、算法复杂度高等问题,提出了一种基于暗通道先验的去雾改进算法。首先通过改进最小值滤波来估计大气光和粗略透射率,再通过峰值信噪比自适应调节雾气参
学位
众所周知,钒酸盐类材料在众多领域有着广泛应用,其中在常温下具有立方尖晶石结构型的ZnV2O4,因具有特殊的微观结构以及迷人的物理性质,在储能,磁光电应用领域而备受学者青睐。然而,对其电子结构,光电特性以及性能增强机制方面缺乏系统性研究,基于此,本课题采用第一性原理的方法探究ZnV2O4的电子结构以及光学性质。此外,掺杂作为材料改性的一个重要手段,本课题选取稀土元素Eu、Yb以及金属元素Mg、Cr、
学位
目的 探究右美托咪啶对大鼠缺血/再灌注损伤肺组织核因子-κB(NF-κB)表达的调控及对缺血/再灌注损伤肺的保护机制。方法 随机将SD大鼠分为假手术组(sham组)、缺血/再灌注组(I/R组)、右美托咪啶组(Dex组)、阿替美唑组(Atip组)与右美托咪啶+阿替美唑组(Dex+Atip组)。在给药结束后,处死大鼠取出左肺组织,检测总肺水含量(TLW)和肺湿干重比(W/D);电镜观察大鼠肺组织超微结
期刊