基于卷积神经网络的图像语义分割

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:cbg668
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
全卷积神经网络(FCN)的图像语义分割算法不仅能够直接处理任意尺寸的图像,省去繁琐的中间步骤,实现端对端像素级分割,而且提高了分割的准确率。但是全卷积神经网络中的池化层在降低网络模型的复杂度和提升运算速度的同时,会由于多次池化层的使用导致成倍降低特征图的分辨率。针对多尺度下的目标分割问题,本文提出了一种多尺度特征融合的图像语义分割方法。具体研究如下:1)采用了跳跃连接方法。新模型将池化层pool3和pool4输出的特征图与空洞空间金字塔池化模块所提取的特征图进行融合,可以将粗糙的深层信息与精细的低层信息融合起来,提高语义分割的精度。2)改进了空洞空间金字塔池化(ASPP)模块。新模型将ASPP模块中卷积层Fc6并行的4种不同空洞率的空洞卷积改为并行6种不同空洞率的空洞卷积,增强了网络从不同尺度捕获特征信息的能力,进一步提高了图像分割的准确率。3)采用全连接条件随机场(CRF)方法。新模型在外端采用CRF改善像素级别分类器的性能,这样不仅能捕获边界细节信息,还能适应远距离依赖,改善分割效果。通过在PASCAL VOC 2012数据集上进行训练和验证,达到了82.0%的平均像素准确率和71.9%的平均交并比。实验结果表明:通过改进空间维度上的ASPP模块及采用全连接CRF方法,达到了良好的图像语义分割效果。
其他文献
传统电子产品以刚性器件为主,具有优异工作性能的同时也存在着局限性,无法适应不平整的工作平面。近年来,可弯曲柔性电子的出现为电子学提供了新的发展方向。作为穿戴式设备
人造的交叉反应受体阵列通过模仿哺乳动物的味觉和嗅觉被用于各种传感应用中。这些阵列通过模式识别算法用于区分分析物,甚至用于预测未知分析物的身份。然而,以往已经开发用
近年来,由于光子晶体微腔结构具有Q值高、有效模式体积小、易于集成、制作工艺简单等优势,使得其在纳米传感结构设计方面得到了广泛的应用,科研人员尝试在光子晶体微腔中通过
大庆油田自开发以来,油田道路作为一个配套工程,始终伴随着油田产能建设系统工程的推进而稳步发展,大庆油田道路系统经过多年建设,不断完善配套,道路布局比较合理。但是,大庆
铸造工艺设计的成功与否影响着铸件的成品率、质量、生产成本等各个方面。传统的铸造工艺设计方案的确定大多依赖于生产实践经验,比较难以精确计算。检测工艺设计的成功与否
研究背景CD99 antigen-like 2(CD99L2)是一种高度糖基化的Ⅰ型跨膜蛋白,不属于任何已知的蛋白家族。CD99L2蛋白分布广泛,在人和小鼠多种器官都有高表达。血液血管系统主要表
自磨机是一种应用于矿石中碎阶段的大型磨矿设备。由于其矿石处理能力强,工艺流程简单等特点,大量的大型选矿厂将自磨机投入到生产中。近年来自磨机技术发展迅猛,其大型化的
现代工业社会的发展对石油的需求量越来越大。石油作为地球上的一种不可或缺资源,其开采效率得到人们越来越广泛的关注。在石油勘探过程中,岩心取样作为一种获得地下岩层的物
智能交通系统作为一种先进的交通管理技术,越来越受到人们的重视,同时随着计算机硬件水平的提升,许多复杂算法所带来的实时计算困难的问题已逐渐突破。本文所研究的车辆检测
视觉跟踪是计算机视觉领域的一个重要研究方向,现在已经广泛用于军事、医疗、机器人、智能交通等领域。近年来,深度学习技术获得了极大的突破,深度神经网络强大的学习能力为