论文部分内容阅读
由于卫星技术的快速发展,高分辨率遥感图像的数据量增长迅速,光靠人工目视解译的方法效率较低、费时费力。随着时间的推移,地表物体会发生一系列改变,例如城市中的建筑物和道路。这需要人们及时从遥感图像上提取并更新信息,以便提供给城市规划、交通规划等其他领域使用。这些工作只靠人工很难完成。因此如何使用计算机来代替人工完成一部分工作甚至整个流程就成为一个重要的研究方向。近年来,深度学习的大力发展给遥感图像信息自动提取提供一条途径。本文基于深度学习对城市高分变率遥感图像建筑物和道路进行语义分割,针对建筑物和道路在遥感图像上的特点选择以UNet和HRNet为基础进行模型优化。本文主要研究内容如下:(1)针对城市高分辨率遥感图像语义分割数据集,在计算资源有限的情况下对UNet从模块改进、特征整合方法及模型搭建三个层次进行改进。本文在UNet模块改进方面使用ResNet,ResNeXt和Res2Net中的Residual模块,分别应用到UNet中替代单个卷积层,并命名为UNet V1-V3,在马萨诸塞州建筑物数据集上进行实验,经过综合比较,UNet V3语义分割效果是三者中最好的。本文整理特征整合方面的方法,提出带权重的串联整合结构,通过数学推导及实验证明该结构在缩小浅层特征和深层特征语义差距上面的可靠性。本文根据前两点在模型搭建方面重新搭建Fused UNet(F-UNet),在参数量有限的情况下,在城市高分辨率遥感图像语义分割任务中取得比较精确的语义分割结果,与此同时也验证带权重的串联整合结构可以在不同模型中起到提高结果精度的作用,有一定的广泛适用性。(2)由于道路和建筑物信息提取对边界信息要求比较高,本文选取并行网络HRNet从特征整合、损失函数及归一化方法三个角度进行优化。首先,根据HRNet多级特征整合的方式,引入门机制来缩小不同级别的特征图之间的语义差距,搭建Gated HRNet(G-HRNet)。其次,在G-HRNet的基础上,针对遥感图像语义分割样本不平衡的问题,本文对比带权重的交叉熵函数(Weighted CrossEntropy,WCE)和注意力损失函数(Focal Loss,FL),发现FL效果更好。最后,由于计算资源限制的原因,G-HRNet中批次归一化(Batch Normalization,BN)的批次大小参数设置太小,效果不佳,因此本文对比和批次大小参数不相关的组归一化(Group Normalization,GN)和滤波响应归一化(Filter Response Normalization,FRN)两种归一化方法,经过实验测试FRN的效果最好,G-HRNet在使用FRN时在马萨诸塞州建筑物语义分割数据集上mIoU达到82.03%,马萨诸塞州道路语义分割数据集上mIoU达到83.91%。