基于深度学习的道路图像语义分割研究及应用

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:zjuxy2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割(Image Semantic Segmentation,ISS)是图像理解的基础,也是计算机视觉技术中最重要的研究任务之一。道路图像语义分割在无人驾驶、安防监控等工业领域中应用广泛,近年来,尤其在移动应用平台中的使用逐渐增长。把采集到的道路图像中的像素精准划分到对应的目标,对于目标监测和场景理解意义重大。目前,道路图像语义分割主要面临两个挑战,一个是准确性:不同目标对象的相异性和相似目标对象的相似性、场景的复杂性、光照变化和拍摄条件等环境因素都会影响分割的准确度;一个是实时性:深度神经网络参数量大、计算时间长制约着分割模型的推理速度,移动应用平台存储空间较小、要求速度快延迟低、结果表现好,对道路图像实时分割提出了更高的要求。本文针对上述问题进行了深入的研究,针对道路图像分割效率的问题,在语义分割网络ENet的基础上进行改进,提出一种新的道路图像实时语义分割网络(Road image Real-time Semantic segmentation Network,RRSNet),改善 了深度神经网络在低延迟任务中运算量大、运行时间长、分割精度不高的缺点,使其更适应一般的移动应用平台。主要研究内容如下:(1)在模型的编码器部分提出了轻量化网络卷积结构,去除影响较小但是重复冗余的网络层,进一步减小网络模型体量,解决模型推理时间长的问题;此外,使用高效卷积模块替换普通卷积模块,获得更大范围的感受野,优化模型性能;(2)使用跨尺度非对称特征融合和同尺度对称特征融合的混合特征融合方式,多重利用不同尺度信息互补,优化不同大小目标的分割效果;提出高效通道注意力模块,把原通道注意力模块参数量减小了近5000倍的同时保持高性能,将模型精度提高了 3.2%;(3)在两个专门描述道路场景的语义分割数据集CamVid、Cityscapes上对RRSNet网络模型进行测试评估,并和ENet网络进行分割效果对比,结果表明RRSNet具有良好的分割效果,在两个数据集上分别获得了 56.37%和62.35%的分割精度,并达到了实时性要求。同时实现了一个简单的道路场景实时分割可视化系统,提供可视化交互界面,提供图像文件的单张查看和视频自动播放的功能。使用现实道路场景监控视频对系统进行了功能和性能测试,具有一定的有效性和实用性。
其他文献
随着第五代移动通信技术的发展,具有高速、低延迟、高可靠性以及无需部署新的路边基础设施等优势的5G技术将为车联网(Vehicle-to-Everything,V2X)带来巨大突破。然而,承载5G蜂窝网络下的车联网中存在一些安全问题,首先在性能方面,根据第三代合作伙伴计划(3rd Generation Partnership Project,3GPP)制定的接入认证标准(EPS-AKA、5G AKA)
学位
语言安全问题由来已久,伴随着网络技术的发展普及,网络空间存在的语言安全问题影响了语言的健康发展,且可能危及国家安全,亟需引起重视,并加强相关治理工作。而网络空间的语言安全与治理问题涉及的理论层次广泛,目前学界综合性、系统性研究较少并且相对分散。对网络空间语言安全问题与语言治理的研究,正有其必要性与紧迫性。本研究以网络空间的语言安全问题为主要研究对象,通过对网络语言安全问题实际例证的梳理,结合具体的
学位
近年来,直播带货行业蓬勃发展,带货主播也于2020年成为正式工种,成为就业新风口。长久以来,人们普遍认为男性在媒介形象塑造中处于优势地位,关注度与相关研究较少,但实际上“坚毅”“强壮”“有冒险精神”等性别气质标签也在潜移默化中加深了男性群体的性别刻板印象,不利于社会对多元化男性形象的接纳。与此同时,有研究表明,男性的反性别刻板印象接受度较低,而女性的反性别刻板印象接受度远远高于男性。但在直播带货场
学位
信息存储的需要推动着光存储技术向超高密度方向发展,基于聚甲基丙烯酸甲酯(Polymethyl Methacrylate,PMMA)材料的多层光存储是其中一大研究热点。PMMA光盘选择新的介质材料和记录方式,带来了许多区别于传统光盘的误码问题。除了电路噪声、激光源噪声等因素,PMMA光盘上的数据还会受到码间串扰的影响,使用过程中形成的划痕、污点等也会引入连续错误。因此PMMA光存储系统需要一个同时具
学位
2013年9月和10月,习近平总书记在出访哈萨克斯坦和印度尼西亚时先后提出建设“丝绸之路经济带”和“21世纪海上丝绸之路”的重大倡议。2015年3月,中国政府发布《推动共建丝绸之路经济带和21世纪海上丝绸之路的愿景与行动》,明确提出“中巴、孟中印缅两个经济走廊与推进‘一带一路’建设关联紧密,要进一步推动合作,取得更大进展”。2015年4月,习近平主席对巴基斯坦进行首次国事访问期间,双方同意以中巴经
学位
在形象学研究中,对文学作品里“异国形象”的探讨经久不衰。就中国文学外译而言,不同译者在目的语文化中塑造的中国形象及其原因值得探讨。《聊斋志异》是蒲松龄创作的文言短篇小说集,该作品以独特的视角和生动的人物形象备受大众喜爱。Strange Tales from a Chinese Studio(2006)出自汉学家约翰·闵福德(John Minford)之手,经由企业出版社出版,一经问世便广受赞誉。本
学位
近年来,固态硬盘制造商通过使用多层存储单元等先进存储技术提高闪存存储密度,降低固态硬盘生产成本,但这些技术使得固态硬盘的数据可靠性不断降低。面对日趋严重的可靠性问题,固态硬盘采用重读方法解决纠错码不可校正的数据错误。重读方法包含多个重试步骤,每次重试步骤会调整读参考电压来重新读取数据,使得纠错码能够校正数据的比特错误。重读方法虽然空间开销小,但是会引入更严重的读干扰问题,而且还会显著增加固态硬盘的
学位
随着科学技术不断进步,计算和数据资源日益丰富,人类面临信息处理的便捷性和安全性两大问题。智能语音技术提供了高效便捷的人机交互方式,经过多年发展已在多个领域落地应用,取得了显著成果,语音识别作为智能语音技术的第一步,对整体交互体验起到关键性作用。我国早已布局自主可控技术研究以保障信息安全性,目前处理器层已有龙芯、飞腾等多款国产处理器平台,操作系统层已有麒麟、深度等操作系统平台,上层应用生态圈建设也在
学位
合成孔径雷达具备高时效性、覆盖范围广、分辨率高等特点,其获取的信息量大、数据流密集,这给星上实时处理带来了很大的负担。在传统单卫星实时处理的模式下,星上数据处理能力和存储空间有限,单卫星很难对大量雷达回波数据实现实时处理,这在一定程度上限制了卫星的响应能力和观测任务的执行效率。如何提升卫星的星上数据处理能力已经成为近年来星载SAR实时成像技术研究中急需解决的一个问题。本文是在国家重点研发计划项目“
学位
在信息时代,全球每年产生的数据量飞速增长。基于玻璃介质的五维光存储技术具有高密度、低能耗、永久存储寿命等优势。其有望成为新一代大容量数据存储技术。但该技术受到三维空间的限制。当数据记录层的间距太小时,数据层之间会发生串扰,形成强烈的背景噪声,降低数据读出的准确率。因此,研究的主要目的:高质量、高效率地去除五维光存储图像背景噪声,提升数据读取的准确率。然而,现有的去噪算法存在去噪效率低、内存消耗高、
学位