论文部分内容阅读
随着遥感技术的快速发展,遥感数据的质量和更新速度都得到了明显的提升,多源遥感数据广泛的应用在农业、林业、海洋、环境保护等多个领域。遥感图像分类一直是遥感技术应用中非常活跃的研究主题,它是指利用遥感数据制作土地利用或土地覆被地图。目前,基于人工智能模型和算法的应用已经变得非常普遍,机器学习与深度学习是实现人工智能的方法,随着深度学习的不断创新,计算机视觉领域在过去几年中发展迅速并不断取得突破。计算机视觉发展的驱动因素是算法的创新、视觉数据量的上涨和计算能力的提升,在图像分类、目标检测与定位、图像分割等任务中,深度学习算法在大量的基准上超越了传统的统计方法,甚至在图像和目标识别方面的能力超过了人类。在农业领域,使用遥感数据进行作物分类是一项重要研究内容,利用遥感影像的时空尺度优势,及时准确的获取作物空间分布、种植面积对保障粮食安全,推动农业可持续发展具有重要意义。高分辨率遥感影像具有背景复杂度高,细节信息丰富、空间结构多样化的特点,将传统的机器学习分类算法应用于高分辨率遥感影像分类时往往存在分类精度低的问题。近年来,许多研究人员尝试通过深度学习算法构建语义分割网络并应用在像元级别的地物精细分类中,基于人工神经网络的遥感影像分类成为发展趋势。本文主要围绕目前基于人工神经网络的语义分割算法在高分辨率遥感影像中的分类应用开展研究,主要研究内容如下:(1)针对深度卷积神经网络中由于网络深度增加而导致的训练困难和网络退化的问题,本文提出了一种采用残差网络作为编码器的深度卷积神经网络CSNet,与现有的模型比较具有深度更深、结构简单、易于训练等特点。首先骨干网络使用50层残差结构设计,充分提取输入图像特征,然后在编码器和解码器中间加入了跳跃连接进行特征融合,输出的特征图既包含了高分辨率时的低级语义特征也包含了高维空间的抽象特征。同时,为了比较微调对模型性能的影响,使用了两种方案对残差块的内部结构进行了调整。在高分一号遥感影像作物分类实验中,微调的CSNet(Res Net C)与基线模型(随机森林、支持向量机)相比,OA(Overall Accuracy)提升了13.3%、9.5%。(2)围绕多尺度神经网络能够在不同的感受野下学习多种特征,进而改善分类精度以及细粒度图像分类的关键性问题,本文提出了一种采用并行多分支结构设计的多尺度特征融合网络MSSNet。首先,该网络使用多分支不对称卷积和空洞卷积,每个分支将具有不同大小卷积核的常规卷积与不同膨胀系数的空洞卷积串连,然后,将每个分支提取的特征进行拼接,进而实现多尺度特征融合。最后,使用一个跳跃连接,将来源于浅层网络的低级特征与深度网络的抽象特征融合,进一步丰富语义信息。在使用Sentinel-2遥感影像的作物分类实验中发现,与FCN32S、FCN8S和UNet比较,MSSNet的分类精度分别高出7.81%、3.59%、2.83%,输出的作物分类图在地块分割以及地物的边缘刻画上效果更好。(3)通过对Seg Net网络进行改进,提出了一种轻量级的基于空间-光谱注意力的语义分割网络A2Seg Net,以解决深度卷积神经网络中的信息过载问题。深度学习中的注意力模仿人类视觉神经系统工作原理,在复杂场景中,基于先验知识自然的关注重要信息,同时忽略次要信息。注意力机制卷积神经网络兼顾效率和精度,通过在多级感受野和特征融合部分插入注意力以解决类内相异性的问题。在基于高光谱图像的作物分类实验中,与Seg Net网络比较,本文提出的轻量级模型A2Seg Net具有较高的推理效率和分类精度,同时具有良好的稳定性。(4)针对卷积运算擅长提取局部特征,但是在长距离依赖关系建模能力上存在局限性的问题,本文提出了一种具有双路编码器的语义分割网络DE-UNet,该网络采用Swin Transformer+卷积神经网络架构设计,Swin Transformer关注多尺度全局特征,卷积神经网络学习局部特征,整合后的特征很好的兼顾了全局和局部的上下文信息。在实验中,本文使用仅有可见光波段的无人机影像对包括DE-UNet在内的三种模型进行了测试,在特征并不丰富的情况下,DE-UNet依然取得了较高的分类精度,总体精度比UNet和UNet++分别高出0.28%、4.81%,说明Transformer的引入增强了模型的拟合能力。综合以上研究工作,本文基于深度学习模型的深度、宽度、注意力机制以及卷积结合视觉Transformer四个方面,提出了CSNet、MSSNet、A2Seg Net和DE-UNet网络。在多源遥感数据作物分类实验中对上述模型进行了评估,实验表明,所提出的算法在作物分类任务上具有良好的应用前景,可以作为作物面积提取、农业补贴发放的补充监测工具。