基于深度学习编解码结构的图像语义分割算法研究

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:xixihahawotiana
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉中,图像分割(为图像中每一个像素进行类别标记的技术)是后续其他研究的基础,所以图像分割效果的好坏会对后续的研究产生影响。基于深度学习的图像语义分割算法面临的主要问题包括:分割场景的复杂性、分割对象的多样性、分割对象空间位置的随机性以及分割模型的精度与计算效率相互制约的矛盾等,本文针对这些问题开展基于深度学习编解码结构的图像语义分割算法研究。本文主要研究工作和贡献如下:(1)对特征提取编码器结构的分析。基于深度学习编解码结构的图像语义分割模型,其编码器对输入图像的特征编码效果会对分割模型的性能产生巨大的影响,因此,本文首先分析了特征编码器的架构与性能,包括高精度的特征编码器VGG-Net、Google Net、Res Net和计算效率优先的Dense Net、Pelee Net,对这些模型的架构和典型的模块进行分析,为本文后续提出编解码架构的图像语义分割模型打下基础。(2)为解决图像语义分割任务中存在的分割场景的复杂性、分割对象的多样性及分割对象空间位置的差异性问题,本文提出一种高精度的基于稠密扩张卷积的双分支多层级语义分割模型。首先采用特征编码器编码输入图像的特征并输出4级不同分辨率的特征图(De1、De2、De3、De4),其次采用本文的特征精炼模块对De1和De3这两个特征图进行特征精炼处理,特征精炼之后的输出分支经过本文提出的稠密扩张卷积模块(以本文提出的混合扩张卷积模块搭建而成的模块)解码空间位置特征,而De4分支采用金字塔池化模块解码抽象语义特征,最后将这两个分支加权融合输出分割预测结果。最终模型在Celeb AMask-HQ测试集中m Io U精度为74.64%,在Cityscapes测试集中m Io U精度为78.29%,均高于对比方法,证明本文模型具有很好的性能与鲁棒性。(3)为在资源受限制的嵌入式设备上部署图像语义分割模型,就必须减少模型的参数量与运算量,取得精度与推理速度之间的平衡,本文提出一种基于Res Net18的平行效率语义分割模型。首先使用轻量级的主干网络Res Net18对输入图像进行特征编码,产生4级特征图(Fe1、2、3、4),其次使用本文提出的一级解码器强化浅层的空间位置特征图Fe1、Fe2和Fe3,使用金字塔池化模块强化抽象语义特征图Fe4;接着将上述强化特征表达后的特征图上采样进行元素级求和,再次使用本文提出的二级解码器处理逐级求和后的特征图,进行空间特征与抽象语义特征的融合,完成预测输出。最终模型在Cityscapes测试集中m Io U精度为73.02%,模型参数量为14.2M,推理一张2048x1024分辨率的图像耗时48ms,精度均高于对比的效率模型,并且模型的参数量和运算量最少,证明本文模型取得分割精度与计算效率之间的平衡。
其他文献
大曲率扩压弯道是离心式叶轮机械中无叶扩压器、弯道和回流器等固定部件的简化模型,弯道内流体会呈现出二次流、流动分离及再附等复杂形态。目前的研究多集中在二维弯道或三维等截面弯道及入口速度固定的简化模型上,而在实际情况中,弯道的高度和通流面积会发生变化,同时其内部流动受到上游叶轮出口处周向通过的“射流-尾迹”结构的扰动。这些固定部件内流动分离的时空演化特征影响了下一级内部流动特征,甚至会影响叶轮机械的性
学位
我国农作物深受农业害虫危害,给国家造成了不可估量的经济损失,因此,对农业害虫种群动态进行实时的监测和及时、有效的防控是确保粮食安全的前提。性诱测报是广泛应用于农业害虫监测的一种重要手段,具有很强的灵敏性和专一性。目前,基于机器视觉的性诱捕器可以将测报人员从识虫和计虫的任务中解脱出来,已成为害虫智能监测研究的热点。但利用性诱捕器拍摄的性诱粘虫板图像存在图像背景复杂、害虫粘连、相似非目标害虫干扰等问题
学位
制备具有节能环保特性的高效分离或吸附材料是目前水处理领域的研究重点之一。离心-静电纺丝是一种优良的纳米纤维制造技术,通过离心-静电纺丝可以得到由纳米纤维堆砌而成的高比表面积与高孔隙率的纳米纤维膜,经后处理可应用于高强度复合材料、电子器件制造、药物传递、食品包装、膜过滤和能源应用等领域。聚乙烯醇(PVA)作为一种水溶性多羟基环保型高分子聚合物,自身无毒无污染的同时,其溶剂为水,且具有优异的成膜性能,
学位
为保护海洋生态环境,国际规定船舶的排放气体必须减少硫化物等有害物质的排放,因此大型远洋油轮中常用脱硫塔对废气进行净化处理。脱硫过程中,输送参与反应的海水需要消耗大量的能源,直排废弃海水又会造成严重的能源浪费。考虑船舶的经济成本因素,采用液力透平对余压丰富的废弃海水进行能量回收的方法在行业中得到普遍的认可。目前,单吸透平能够适应绝大多数工况,实现能量的高效回收,然而在船舶脱硫工艺中超大流量、极低水头
学位
卡马西平作为一种抗癫痫药物,由于其生物降解性差,在废水中经常被检测到。光芬顿技术由于绿色、高效被广泛应用于处理难降解废水,MIL系列Fe-MOFs材料具有优异的可见光捕获能力和高度分散的铁活性中心被认为是光芬顿催化剂的潜在选择。然而大多数铁中心被有机连接物完全占据,使其不能用于活化H2O2。原始Fe-MOFs在光催化过程中面临着光生电子-空穴对快速复合的问题,所以抑制电子-空穴对的复合对于提高材料
学位
目前,有机发光二极管(OLED)已经实现了产业化,相对于其它的显示设备,OLED具有自发光、低起亮电压、广色域、广视角和结构超薄等优势。而在产业化进程中,OLED的成本一直居高不下,严重限制其了发展。原因主要有两方面:其一,发光层材料的分子结构复杂,合成成本及提纯成本较高,而且有些前驱体材料也是价格不菲;其二,目前器件的制备工艺以真空蒸镀为主且大部分发光层均为掺杂结构,这无疑增加了工艺难度及生产成
学位
本翻译实践报告(日译汉),选自日本法政大学出版局于1976年出版的日本比较文学学者、翻译理论学家柳父章的《何谓翻译——日本语与翻译文化》。全书通过引入“カセット効果(宝匣效应)”的概念,深入分析了日本明治时期以来“翻译语(翻訳語)”——“权(権)、自由(自由)、他(彼)”出现的社会历史背景以及Society的译词诞生过程。本翻译实践报告节选自该书的第一章节“论‘宝匣效应’(「カセット効果」の説)”
学位
聚丙烯(PP)因其价格低、易加工、耐化学腐蚀、电气绝缘等优点而被广泛应用于医疗、工业和日常生活等领域。然而PP具有很高的可燃性,且其在燃烧过程中通常会释放大量毒烟并产生高温熔滴,这会严重危害生态环境和人类生命财产安全,从而极大限制了 PP的进一步开发应用,因此须对PP进行阻燃改性。出于保护生态环境和人类生命的考虑,燃烧时会分解出具有毒性和腐蚀性气体的卤素阻燃剂已被禁用,逐渐被安全、环保的无卤阻燃剂
学位
彝族鸡冠帽别具一格,独具特色,历经岁月沉淀传承至今,是历久弥新的最好体现,凝结着彝族历史底蕴,是中华民族文化瑰宝。彝族鸡冠帽上的图案也独具魅力,不论是自然界中各类动植物图案,还是人为创造出来的用来装饰的几何图案,在漫长的历史发展中,都形成了自己独特的表现形式。彝族鸡冠帽既是一种具有代表性的文化信息载体,也是一种承载着不同时期审美演变的特有文化符号。彝族鸡冠帽在彝族物质和精神文化的熏陶下,呈现出多姿
学位
卷积神经网络技术在计算机视觉领域中发挥着越来越重要的作用。基于卷积神经网络的人体行为分析与识别算法主要通过目标检测技术、人体骨骼关键点检测技术和人体行为分类网络技术对视频和图像中的人体目标进行定位、行为分析与行为识别。本文研究内容由浙江省重点研发计划项目——基于“智能亚运”等重大活动公共安全需求的关键技术、装备研究及应用示范项目课题支持。由于监控摄像头和人体目标之间存在一定距离和角度,导致监控图像
学位