复杂环境下图像语义分割算法研究

来源 :湖南理工学院 | 被引量 : 0次 | 上传用户:zj888666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,得益于深度学习强大的特征提取与模型适应能力,其在多个计算机视觉领域取得了突破性进展。图像的语义分割作为计算机视觉领域的一个重要分支,备受研究者的关注。当前复杂环境下图像语义分割的主要研究点主要集中在提升分割精度、速度以及增加其在现实生活中的应用范围。具体来说,目前图像的语义分割在提升分割精度中还存在着小目标、物体边缘分割效果不佳以及上下文建模困难导致物体错分的问题。针对以上问题,本文以深度学习中卷积神经网络(Convolutional Nerual Network,CNN)和transformer结构为基础,提出基于编码器-解码器结构的复杂环境下图像语义分割模型,具体如下:针对全卷积神经网络(Fully Convolutional Networks,FCN)框架中编码器结构高等级特征图中边缘细节信息丢失以及缺乏多尺度特征捕获能力的问题,本文提出一种基于改进全局注意力模块的双金字塔网络(Global Attention Double Pyramid Network,GADPNet)结构来提高语义分割的性能。GADPNet结构由Resnet-101,空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块,改进的全局注意力模块和提出的金字塔解码器结构组成。其中Resnet-101是提取输入图像不同层次特征的主干网络;ASPP模块用于捕获单一高等级特征分支中的多尺度信息;改进全局注意力模块降低低等级特征图中像素错误分类的可能性,保留低等级特征图更精确的细节信息,在此基础上,金字塔解码器结构则是将ASPP模块捕获高等级特征图中的多尺度特征和指导后低等级特征图中的多尺度特征进行融合,从而增强网络结构多尺度特征的捕获能力。实验结果表明,所提出GADPNet表现出较好的语义分割精度,其在Pascal VOC 2012测试数据集和Cityscapes验证数据集上得到的平均交并比值(mean Intersection over Union,m Io U)分别为80.5%和72.9%,所提方法优于FCN、Deep Labv2等方法。针对目前的场景图像语义分割方法缺乏充分利用特征图局部和全局上下文信息,导致目标错误分类以及单独对物体边缘分割质量研究较少,物体边缘分割识别效果不佳的问题,本文提出一种结合物体主体和边缘的场景图像语义分割算法。在利用语义流信息保持物体主体内部一致性的基础上,设计了主体上下文特征提取模块,充分考虑分割目标的局部和全局上下文信息,在网络中间层阶段细化粗略特征图来减少目标对象错误分类的情况。此外,为提升物体边缘分割效果,提出的边缘注意力模是将全局特征引导的低级特征图和高等级特征图之间操作获得的具有语义信息的边缘特征图连接起来,以获得更准确的边缘细节信息。最后,物体主体和边缘部分的分割特征图的连接形成最终的特征图。本文所提方法不仅在经典的FCN、PSPNet和Deep Labv3+主流网络上进行实验,还在最近提出的SFNet实时语义分割网络结构进行了实验,整幅图像和目标边界分割m Io U的值提升以及可视化分析验证了本文所提算法的有效性。为了证明实验的鲁棒性,我们在Cityscapes、Cam Vid和KITTI三个复杂场景语义分割数据集上进行了实验,在Cityscapes验证数据集上得到的m Io U值为80.52%,在Camvid和KITTI测试数据集上的m Io U值分别为71.4%、56.53%,与目前先进的场景图像语义分割的方法相比,本文所提算法展示出了更好的分割识别结果。针对卷积神经网络局部感受野的固有缺陷,导致基于CNN的场景图像语义分割方法无法捕获全局感受野,难以在复杂场景中进行全局上下文信息建模的问题,本文提出一种基于transformer结构的场景图像语义分割方法。具体来说,在利用transformer主干网络在每个阶段捕获全局语义信息的基础上,所提金字塔transformer模块是通过空洞卷积以局部连接的方式捕获transformer主干网络所得特征图中的多尺度特征,transformer中的自注意力机制对多尺度特征建模,增强特征图中多尺度信息捕获的能力;此外,所提Mt FAM解码器结构通过提升高等级特征分类能力的同时,并与低等级特征对齐后融合来增强小目标和物体边缘的分割能力。本文提出的金字塔transformer模块可以添加到Resnet和视觉transformer等主干中实现端到端的训练,且足够的实验证明了所提出方法的有效性。与Vi TTiny作为编码器结构语义分割网络相比,所提出的方法在ADE20K验证数据集上m Io U的值提高了3.63%。最后,本文所提出方法在具有挑战性的ADE20K场景分割数据集上获得的m Io U值为49.90%,比相同transformer主干下的Segmentation Transformer方法高了0.62%。本文分别从注意力机制、结合物体主体和边缘、cnn和transformer结构结合的三个角度研究出发,分别提出一种基于改进全局注意力模块的双金字塔结构的图像语义分割方法、一种结合物体主体和边缘的场景图像语义分割方法、一种基于transformer结构的场景图像语义分割方法。充足的实验验证了所提算法的有效性,为复杂环境下图像语义分割算法的研究提供了新思路。
其他文献
随着2006年相关政策法规的出台,定向增发开始逐渐发展,相关制度的完善也为定向增发扩大市场规模提供了有力保证。由于其程序简便、无硬性盈利要求、融资快等优点,定向增发规模迅速增长,已经成为中国证券市场上最为常用的再融资方式,这也引起国内外投资者和学者的广泛关注,但对于定向增发的股东财富效应未达成一致结论。鉴于此,本文对此做出深入研究,主要通过事件研究法来实现。同时,关于投资者异质信念的理论研究已经成
学位
目的 研究凝血相关指标预测B族溶血性链球菌(GBS)感染产妇不良妊娠结局的价值。方法 选择2018年6月—2020年1月德州市人民医院的110例GBS感染产妇作为研究对象,按妊娠结局分为良好妊娠组和不良妊娠组。收集所有患者临床资料,包括年龄、体质指数(BMI)、受教育程度、产次、有无早产史或流产史、近1年有无尿路感染或阴道炎、有无妊娠期糖尿病、凝血酶原时间(PT)、活化部分凝血活酶时间(APTT)
期刊
融资融券交易是信用交易的一种,它为证券投资提供新的选择方向,在证券交易中已成为不可或缺的交易方式之一。自从2010年融资融券政策试点以来,我国融资融券市场逐步发展,融资融券交易标的的股票数量也逐渐增加。截至2020年末,我国证券市场经历了六次大规模的标的扩容,沪深两市可进行融资融券交易的股票数量超1800家,交易规模占我国证券市场总交易额的10%左右。但对于融资融券对我国股票价格波动的影响学术研究
学位
目标跟踪在计算机视觉领域中扮演着重要的角色,是一项基础而充满挑战的任务,广泛应用于智能交通、智能监控、自动驾驶和军事工业等领域。随着深度学习技术的迅猛发展,涌现出优秀的彩色视频图像目标跟踪算法,跟踪的速度和精度也在不断提升,但是在目标形变,目标被遮挡等具有挑战性的场景中,彩色视频目标跟踪算法容易失效。高光谱图像(HSI)包含了目标大量的光谱材质信息,这些特征信息针对目标形变、遮挡等挑战性因素具有较
学位
高光谱图像异常检测是遥感图像领域中最重要的研究课题之一,具有十分重要的理论和应用价值。因此,如何实现高效的高光谱图像空谱特征提取及异常检测是本课题的研究重点。高光谱遥感图像有几十甚至上百个连续的光谱通道和丰富的空间结构信息,但也存在波段间高度相关、空间分辨率不足的问题,导致传统特征提取方法在复杂空谱结构上的表征能力差。本文从子空间表示和特征提取等角度出发,提出了多种高光谱遥感图像异常检测算法,较好
学位
创新是提高与维持企业竞争力的重要保障,也是促进国家经济高质量发展的重要驱动力。近年来我国企业创新投入不断增加,但部分企业对于创新能力的关注仅体现在增大研发投入规模上,而忽略了提高创新产出速度。实际上,当企业的创新效率能够提高时,企业的长远竞争力能得到更好的提高。企业创新需要长期大量的资金投入,就当前我国融资背景而言,股权质押由于其融资速度较快、成本较低、审核条件较不严苛的优势,逐渐成为企业进行融资
学位
随着我国经济发展质量的不断提高,金融市场活跃程度明显提升,越来越多的实体企业也纷纷参与到金融领域的投资和交易活动中,其特点就是对金融资产的持有份额日益增多。首先,相较于固定资产来说金融资产因其更高的流动性而受到投资者的青睐。因此实体企业出于闲置资金利用或盈余管理的目的选择持有更多的金融资产,在提高流动性的同时有利于优化企业的资本结构,降低企业的风险承担水平。其次,金融资产通常有着较高的收益率,有相
学位
<正>春节前的一天,天门农商银行石家河支行网点人声鼎沸,前来办理业务的客户排起长龙。一名男子急匆匆地走到大堂经理杨国旗面前。“我是西河村的治保主任,能否借一步说话?”原来,西河村特困户朱中华常年瘫痪在床,平时靠低保维持生活,家里还有一位80多岁的老母亲。前不久,村里帮他家申请了一笔15000元的危房改造款,
期刊
在影响经济发展的众多因素中,创新已经逐渐占据关键的地位。近年来,我国一直坚持引导科技研发发展,推动国家整体研发实力的增强。企业作为创新活动的重要主体之一,近十年来其研发经费支出占总量的比例一直保持在三分之二以上。企业进行技术创新,提高自主研发水平,是企业在竞争中占据有利地位、实现优质发展的有力保障。可是企业研发活动却通常成本较高并且伴随着较大的风险,对于研发资金的充足性和稳定性的要求较高。由于企业
学位
手性分子是指其镜像不相同、不能重合的具有构型的分子,不同种类的手性分子在生物体内承担的功能各不相同,从而探索手性分子种类识别以及化学反应参数的测定具有重要的应用价值。针对传统的纸层析法、茚三酮法、等电点法等手性分子识别方法会破坏样本以及常用旋光法仪器旋光计的测量精度较低等不足,本文基于量子弱测量系统提出一种便捷、非侵入、高精度的手性分子种类识别方法,并在此基础上实现手性分子化学反应动力学参数的高精
学位