基于编解码卷积神经网络的遥感图像语义分割研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:romeolg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
遥感图像分割是理解遥感图像的基础,在防灾减灾、环境治理以及城市规划等领域有着重要作用。在过去,人们常常使用与图像分割有关的传统方法来处理遥感图像。传统的图像分割方法不管是在分割的精度还是分割的效率都是很低的。近年来,随着深度学习在计算机视觉领域的广泛应用,尤其卷积神经网络的在提取特征的显著优势,使得图像在分割的速度和精度上都得到了很大的提升。同时,基于深度学习的模型可以实现便捷的端到端的训练学习。因此,研究并设计用于遥感图像分割的深度学习网络具有重要意义。本文所做的工作如下:1.简要地概述了遥感图像分割的研究背景、意义以及国内外研究的现状并对现有的遥感图像分割方法做了分类及总结。然后,详细阐述了深度学习和图像分割的理论知识,以及经典的基于卷积神经网络的图像分割模型。2.编解码的网络结构是一种典型的基于深度学习图像分割模型。在编码部分,包含了卷积、池化等操作。其中,池化本质上是一种信息的采样。通过下采样可以对图像压缩,进一步提取图像的高级语义特征。但存在采样后的信号,可能完全退化为不同形式,我们称这一现象为混叠。这会造成网络在解码端在对图像细粒度的细节信息无法重建。为此,提出在下采样前插入低通滤波器层,自适应处理图像的前景、背景信息,以减少下采样带来的混叠效应。此外,在编解码结构中,跳跃连接将编码器与解码器相连接,在一定程度上减少了由于下采样带来的细粒度空间信息的损失。但忽略了不同层级的特征的融合,可能存在的语义上的间隙。本文在跳跃连接中引入残差融合模块,它能优化网络训练,同时减少不同层级的特征语义差异。3.上下文信息对于图像的分割至关重要,尤其是在有着较大尺度变化的遥感图像中。上下文信息的获取是基于多尺度的特征。在编解码结构的中间部分,采用具有不同膨胀率的空洞卷积构成的并行模块提取特征的多尺度信息并整合与目标有关的上下文信息。此外,由遥感图像的较大的背景类内差异以及前景和背景的不平衡问题,使得多尺度的信息存在一定的冗余信息的干扰。本文利用注意力机制能够抑制冗余信息的干扰,突出对目标的有用的特征,在上下文信息提取模块后引入自注意力引导模块。在Deep Globe Road Extraction和Inria Aerial Image Labeling数据集上测试,验证了所提方法能够改善分割的效果。
其他文献
近年来,神经网络已经应用在无人驾驶、医学、地质探测等各个领域。随着卷积神经网络的发展,从Le Net网络结构到VGG网络结构,网络越来越深,每层的规模也越来越大,随之而来的是计算量和参数量越来越大的问题。一般神经网络的训练计算由服务器端进行,再将训练好网络发送到终端进行推理计算,以满足终端的智能化需求。但该传输过程可能会造成用户一些隐私数据的泄露,缺乏安全性,同时终端也缺乏本地的自我训练调整的能力
随着科技的发展,以及人工智能领域各项技术的逐渐成熟,多智能体系统已成为人工智能一个热门研究方向。多智能体系统由分布式人工智能演变而来,其研究目的是解决大规模、复杂、实时和有不确定信息的现实问题,而这类问题是单个智能体所不能解决的。多智能体深度强化学习是解决多智能体问题的重要方法,但目前的多智能体深度强化学习方法主要针对只有数个智能体的环境,而在多智能体越来越庞大的环境中,智能体的策略变得更加重要也
“十四五”规划纲要提出,要加大对大数据,工业智能,区块链等新基础设施的投资,信息化程度将进一步加深。网络信息科技也随之提升,然而有的人却会利用技术对人们的隐私与财产安全带来巨大威胁。网络信息安全面临全新的,繁杂的挑战。入侵检测系统作为网络安全领域的一个重要组成,在面对异常入侵,用户误操以及内部攻击时提供及时的防护,所以研究入侵检测系统已经成为相关从业人员重点研究方向。近年来随着深度学习在语音识别、
在工业生产中安全是首要任务,但日益复杂的工业现场环境给安全生产带来了极大挑战。当前工业现场常用的安全监测方法有:基于人工的巡查方法、基于机器视觉三维成像的目标识别方法、基于卷积神经网络的目标识别方法。人工巡查的检测精度、频率和范围都是有限的,因此基于机器视觉三维成像和基于卷积神经网络的目标识别方法得到了广泛应用,并能够运用于极端恶劣环境中,但基于机器视觉的三维检测方法自动化程度仍然不高,往往需要辅
老年人口的快速增加是一个迫切的社会问题。近些年来,科研人员在研究如何能够让老人在家中安全养老付出过很多努力。研究发现,行为识别是判断一个人是否具有生活自理能力的重要评估方法。该方法通过监测老人的行为可以得知其认知水平和健康状况,并在必要时能够及时做出预警。这对于提高老人的健康水平和居家生活质量至关重要。然而,要想能够尽可能准确识别老人的行为,至少需要准确的数据、合适的特征和符合老人活动规律的模型。
无线传感器网络(Wireless Sensor Network,WSN)常被应用于灾害预警、医疗监测、工农业生产、国防军事等各个领域。在WSN中,一方面节点电池容量有限导致网络寿命有限,另一方面广播特性使得通信干扰严重、吞吐量低,这两点是制约WSN大规模部署的重要因素,然而这两个问题相重叠使得系统模型更为复杂。为了有效提高网络吞吐量、延长网络寿命,本文提出将串行干扰消除(Successive In
化工园区作为一个易燃、易爆、有毒重大危险源高度集中的区域,一旦发生火灾、爆炸或毒物泄漏扩散等事故,将造成一系列的连锁反应,并产生灾难性的后果。为此,利用大数据、人工智能等高新技术提高化工园区风险感知、监测预警、协同救援和应急处置的能力,已成为新发展格局下的重点领域之一。其中,化工园区应急物资分配是开展危化品事故应急救援的基础,是体现化工园区应急管理能力的一个基本要素。主要研究在危化品事故发生后,如
高分辨率SAR(Synthetic Aperture Radar)图像在卫星遥感、灾害监测等领域具有重要实际研究应用价值,但实际SAR成像分辨率往往难以满足应用需求。传统SAR图像超分辨率重建方法对模型和先验知识要求较高,重建效果往往不理想;无监督式生成对抗网络模型通过训练学习高低分辨率图像之间映射关系,减少先验知识依赖,重建图像效果明显优于传统方法,但博弈对抗式训练方法往往会使重建图像产生“伪影
互联网的迅速普及打破了信息传播的专业门槛,使得越来越多的人们可以通过社交媒体方便地获取信息、分享和表达观点,这极大的丰富了人们的日常生活。然而,由于社交媒体的用户数量巨大,出于各种目的捏造的虚假新闻层出不穷。再者,随着技术的进步,虚假新闻不再单纯的以文本的形式传播,更多是通过文本、图片和视频结合的方式进行扩散,极大地增强了虚假新闻的迷惑性,也使得以往仅仅依赖文本内容进行分析的虚假新闻检测方法不再适
随着人们对于自身安全以及公共安全的日益重视,视频监控系统遍布世界各地。海量的视频数据得以保存,如何快速地且智能化地分析和处理视频监控系统拍摄到的视频以及图像数据,是当下亟待解决的问题。作为智能监控系统中的一种不可或缺的技术,行人重识别(person Re-identification,Re-ID)受到了学术界的重视,其主要任务是在跨摄像头视域下匹配同一目标行人。近年来,随着深度学习技术的逐渐成熟,