基于卷积神经网络的城市场景实时语义分割研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:banlangen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割是计算机视觉领域中三大基本任务之一,在地理信息处理、自动驾驶、智能医疗和计算摄影等领域发挥着重要作用。近年来,随着高质量标注数据的产生与计算机GPU硬件的发展,大规模卷积神经网络成为语义分割任务中主流的解决方案。然而,大规模卷积神经网络结构复杂、参数数量多,限制了其在计算和存储资源有限的低功耗移动设备上的应用。研究轻量化的实时语义分割网络,使其在分割精度、网络规模和运行速度上达到更好的平衡具有重要的现实意义。因此,本文基于卷积神经网络对城市场景下的实时语义分割方法进行了深入研究,主要工作如下:(1)针对轻量化主干网络对全局信息表示能力不足的问题,提出一种采用编码器-解码器架构的快速卷积注意力网络。编码器中,引用短期密集拼接网络作为主干网络,增强对特征的表示能力。解码器中,引入快速卷积注意力模块,对主干网络中每阶段的输出特征平面进行全局信息增强,学习其中通道、宽度和高度3个维度两两之间的关系。通过级联的方式逐级对各阶段的特征平面进行上采样并恢复分辨率。在城市场景数据集Cityscapes上的实验表明,快速卷积注意力网络在单个RTX 2080Ti GPU上达到112帧/s的运行速度,在平均交并比的评价指标上达到71.9%,在分割精度和运行速度上达到了较好的平衡。(2)针对Mobile Netv2模块在轻量化主干网络中性能下降和参数数量多的问题,提出一种空洞Mobile Net模块。其通过额外的空洞深度可分离卷积层,使模块在保持低参数数量的同时增强对特征的表示能力。在城市场景数据集Cityscapes上的实验表明,空洞Mobile Net模块在轻量化主干网络中相较于Mobile Netv2模块具有更好的分割精度,更小的网络规模和更快的运行速度。(3)针对轻量化卷积神经网络中一般不考虑融合特征之间的关系,常使用线性方式进行特征融合,导致网络分割精度有限的问题,提出一种用于实时语义分割采用编码器-解码器架构的轻量化卷积注意力特征融合网络。编码器中,使用空洞Mobile Net模块作为主干网络的基础模块。解码器中,引入一种卷积注意力特征融合模块,学习2个待融合特征平面之间的关系并分别分配权重,提高轻量化卷积神经网络中的特征融合效果。轻量化卷积注意力特征融合网络仅有0.68m参数,使用单个RTX 2080Ti GPU在城市场景数据集Cityscapes和Cam Vid上进行实验,在平均交并比的评价指标上分别达到了72.7%和67.9%,运行速度分别为86帧/s和105帧/s,在分割精度、网络规模与运行速度之间达到了较好的平衡。
其他文献
在中小学的学习过程中,学生往往会犯下一些错误。教师对犯错学生进行一定的惩戒,能够帮助学生引以为戒,从而有利于学校和老师对于学生的管理,也有利于学生的进步与提高。但对学生的教育惩戒是有一定限度的,要保证学生在接受教育惩戒的过程中自尊心不受到伤害,并且使学生虚心地接受教育,进而促进学生的成长、成材。基于此,本文浅谈教育惩戒活动中教师对学生的尊重。
<正>进入2022年以来,日本与澳大利亚的安全与防务合作取得突破性进展,两国间“特别战略伙伴关系”或“准同盟”关系发展到一个新的高度。随着中美战略竞争成为“新常态”、美国推行“印太战略”以及乌克兰危机升级产生外溢效应,同为美国重要盟友的日澳两国强化军事合作动力十足,且针对性强,将对亚太地区的安全形势产生重要影响。
期刊
<正> 测量变压器线圈直流电阻的方法很多。但使用双臂电桥测量,具有很多优点:它测量范围较宽,准确度高(范围为10-4~11Ω,准确度为0.2级),能够较准确地找出被测物存在的问题。如:我局白城一次变2号主变,在1981年测量直流电阻,发现C 相较三相平均值差18.4%,吊芯检查,为C 相引线开焊;1982年,测得扶余二次变2号主变C 相直流电阻较三相平均值差8.6%,吊芯检查,发现为C 相引线焊接
期刊
“新工人诗歌”诞生于市场经济盛行之下的农民工群体中,而后借由媒体、舆论、网络的力量,逐渐挤入文学界,被部分读者了解。作为底层的新工人群体,他们用诗歌展现了真实的、直接的底层生活经验,为现代诗歌包括文学的发展贡献了一个新的群体以及一种新的写作方式,即新工人群体以及人民性的写作方式,填补了文学创作上的缺憾。但新工人诗歌的问世却遭遇重重困难,经济上难以自足,严重挤压创作时间,在社会上处于沉默的状态,更是
本实验在传统酥性饼干中添加红枣粉,重点研究红枣饼干的新配方对饼干质量的影响。通过单因素与正交实验,最终确定了红枣酥性饼干的最佳配方为面粉100 g,鸡蛋15 g,盐0.20 g,奶粉2.0 g,红枣粉23 g,白砂糖15 g,瓜子油25 g,小苏打0.5 g,水10.0 g。此配方既能满足普通大众的营养需求,也能保证产品的质量要求。
非遗文化与乡村旅游融合发展是大势所趋,非遗文化的输出成为乡村旅游的重要环节,乡村旅游也为非遗文化提供了更大的生存发展空间。随着互联网技术和大众传媒的不断更新,以抖音、快手、微博为代表的新媒体平台所构成的新媒体矩阵逐渐参与到非遗文化与乡村旅游融合发展中。新媒体矩阵打破了非遗文化传播的时空限制,拓展了乡村旅游文化的输出渠道,但发展过程中存在非遗传承人缺乏新媒体输出意识等问题。本文结合周村古商城与商河县
视觉传达设计能够应用一定的传达技术通过多元化的媒介,以排版、绘画、平面设计、插画、色彩的形式进行展现。而随着新兴媒体的出现,视觉传达设计概念外延扩大,其表现和传播方式都突破了传统媒体的局限。文章阐述了新媒体的概念,对新媒体背景下视觉传达设计的信息传播特点、语言特点和审美特征进行了阐述,并从多个角度提出了新媒体背景下视觉传达设计的方法。
随着我国信息技术的不断改革和发展,社会各界越来越重视对新媒体的应用。如今,新媒体已被各行各业广泛应用,视觉传达设计专业也顺应时代发展需求,将新媒体技术与视觉传达设计专业相结合。但企业在将视觉传达设计与新媒体结合过程中还存在未重视对新媒体技术的应用、新媒体技术的应用过于简单、作品同质化的问题频繁出现、缺少新媒体与视觉传达设计人才等问题。文章对新媒体背景下视觉传达设计的特征与发展进行分析和思考,并提出
我国煤炭生产继续向西部资源富集区转移,将进一步加剧煤炭生产和消费逆向分布的供需矛盾,尤其是在极端天气、疫情等重大突发事件影响下,我国煤炭短时稳定供应的压力更加严峻。通过分析我国煤炭物流发展现状和存在的问题,研判煤炭供给格局变化及煤炭净调出区未来发展趋势,依托新一代信息技术,提出区域煤炭智慧物流体系的规划方案和具体实施路径,并从人才培养、资源整合、市场化运价等方面提出促进煤炭智慧物流体系建设的政策建
探讨了以玉米为原料酿制麸子酒的生产工艺 ,并对酒的主要营养成份进行了分析。