基于金字塔池化和注意力机制的图像语义分割

来源 :南昌大学 | 被引量 : 0次 | 上传用户:cuicuiCUICUI123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像语义分割是计算机视觉领域的主要任务之一,其目的是对图像中的每个像素点进行分类,预测像素点对应的语义标签。随着深度学习研究的不断深入,基于卷积神经网络的语义分割算法通过多层级联的复杂结构直接从图像中提取更具有表达能力的目标特征信息,提高了分割的精度。为了更有效提取图像的特征信息以增强分割效果,本文基于深度学习技术,从高效利用卷积神经网络各层级特征信息的角度出发,对多层特征融合的语义分割算法进行研究,主要工作如下:首先,提出一种基于金字塔池化的多层特征融合语义分割方法DSPN,该方法利用卷积神经网络提取到的高分辨率浅层特征能够保留更多的局部信息和高语义信息深层特征有利于准确分类的特点,有效解决特征图在多次下采样过程中由于细节信息丢失而导致的分割精度受损问题。DSPN模型采用轻量级的网络Mobile Net V2作为基础网络进行特征提取,将金字塔池化结构作为编码网络的最后一层,用来提取图像的全局上下文信息。在解码阶段将深层特征不断上采样并逐层与对应尺寸的浅层语义特征融合,有效的结合了网络中深层语义特征和浅层局部特征来提升分割的精度。其次,本文继续对DSPN进行改进,提出了基于金字塔池化和混合注意力机制的语义分割方法A-DSPN。该方法引入了混合注意力机制,结合通道注意力和空间注意力为特征图的不同部分分配权重,增强特征的表达,提高对特征的全局感知能力。同时,在训练过程中添加了辅助损失函数来优化学习过程,保证网络稳定的收敛和提升网络的性能。最后,分别在两个公开数据集Cam Vid和PASCAL VOC 2012上对本文提出的方法进行验证与评测,实验结果表明,本文提出的分割方法在减少模型参数量的同时能有效提升网络的分割性能。
其他文献
随着中国人民物质生活愈发丰富,精神追求也愈发提高,健身需求愈发强烈,全国健身工作室雨后春笋般的建立起来,但面临着健身教练不专业,门面租赁贵,成本高,抗风险能力弱等困境,传统健身行业渐渐衰弱。在线健身行业逐渐崛起,但处于信息大爆炸的时代,如何从海量的健身知识里面选取最适合的健身信息也是亟待解决的一大难题。推荐系统能够解决信息过载,将信息过滤过程从“用户主动寻找”转变为“系统主动推送”,解决用户当前困
古诗词作为中华文化中的瑰宝,不仅在当代人文化建设中反映他们的精神生活,而且对现代人的情操陶冶和文化修养有重要帮助,因此,古诗词的研究价值是不容小觑的,也具有长远的研究意义。随着信息时代的快速发展,越来越多的学者开始研究自然语言处理领域的相关工作,数据的处理也用现代计算机智能化技术来取代传统的手工。文本分类技术作为自然语言处理的经典问题之一,能够有效对海量文本数据进行自动归类,虽然已在现实生活中有广
磁共振成像可以无损地描绘患者体内的结构和功能特征,为当今的医学诊断和研究提供了支持。但是,磁共振成像数据采集速度缓慢导致了非理想的空间分辨率,引起患者不适并阻碍了对时间要求严格的诊断的应用。而快速磁共振成像重建技术可以很好地克服上述缺陷,因此,吸引了众多研究者的关注。深度学习特别是生成模型的快速发展为快速磁共振成像重建技术提供了新的方案,本论文研究基于生成模型的磁共振快速成像重建无监督学习方法。在
在实际生活中存在大量的由数值型和分类型所组成的混合型数据,K-Means算法作为聚类分析算法之一,却只适用对数值型数据挖掘分析,当面对混合型数据时它就显得有些无能为力。经过学者们对混合型数据聚类算法的深入研究,提出了一种可以处理混合型数据的K-Prototypes算法。它具备像K-Means算法一样简单、高效、强伸缩的优点,但也容易受到初始中心点随机选择、聚类数目人为指定、混合属性相异性度量不准确
随着科学技术的进步,图像已经成为人类获取和利用信息的主要方式之一。日常生活中人们对于图像质量的要求也越来越高,不再满足于不模糊的图像,而是追求更高分辨率的图像。虽然人们不断追求更高分辨率的图像,但是现实生活中低分辨率的图像往往更容易获得。现在的图像超分辨率技术可以利用低分辨率的图像得到高分辨率的图像。本文针对的人脸图像超分辨率属于特定应用域的超分辨率技术,可以在其基础上对低分辨率人脸图像完成人脸属
病理切片对临床诊断以及病理学研究有着重要的意义,数字切片的出现提高了病理医生的工作效率,为远程病理诊断以及AI医疗辅诊提供新的研究方向。然而中心化的存储以及医疗隐私泄漏等问题导致切片数据在医疗机构中形成了数据孤岛,阻碍了数字切片技术的进一步发展。区块链技术的发展为医疗数据存储与共享提供了新思路,去中心化、不可篡改、可溯源等优点使其被广泛的使用在数字货币、商品溯源、医疗安全等领域。Hyper Led
随着计算机的处理速度不断提高,信息技术与其相关的业务也呈现爆炸式增长,其中就包括互联网、物联网以及各类信息网。网络技术和多媒体技术在各种应用领域的高速发展,同时刺激了市场对数字产品的需求。但随着数字产品的应用日益增多,信息的非法复制、编辑等问题也是层出不穷。数字水印技术是解决上述问题的有效方法之一,可以有效地应用于数字产品信息的安全防护。数字水印技术通过将需要隐藏的信息嵌入到信息载体中,防止信息在
随着我国城市化建设的逐步完善,降低城市火灾发生率,减少伤亡和损失一直是城市消防建设的重大目标之一。现有的火灾预警系统或智慧消防系统能在火灾发生时及时报警,但尚存诸多不足:(1)系统缺乏大数据技术的支撑,不具备数据集中化管理能力;(2)面对海量的消防数据,缺乏有效的数据挖掘和分析应用;(3)现有火灾预警系统依靠物联网设备实现,缺少火灾预测的应用或预测效果不佳;(4)城市火灾预防采用的消防单位安全风险
随着电子信息化的崛起和科学研究的迭代,人们的生活也在进行着改变,信息的过载已经是目前计算机应用里要面临的重要问题,用户们需要从大量的信息中耗费时间来提取自己所需要的信息。而推荐系统就可以为用户筛选出有效的信息,来解决这个问题。目前协同过滤推荐,混合式的推荐等方法已经在很多互联网平台中得到了应用,为用户来推荐想要的信息。同样的,随着电子商务的迅猛的势头,网上购物行为在人们生活中开始扮演着不可或缺的角
现如今,利用信息系统进行业务和数据管理已是日常办公的主要手段。然而,随着对系统的不断使用以及用户的不断增加,大并发和海量数据带来的性能瓶颈日益突显,因版本迭代导致的模块更新也越来越频繁。如何能在大数据、高并发的情况下保证业务系统的高效运行,以及如何在模块迭代过程中保证其它业务模块正常运行,是当下行业信息化系统亟待解决的两大应用痛点。本文所设计的管理信息系统(MIS)通用框架,从软件的可复用性角度出