论文部分内容阅读
高分辨率遥感影像(简称,高分影像)的建筑物提取工作,对于社会经济建设、城市规划以及地图绘制等方面具有重要意义。由于建筑物本身的各异性及背景地物的干扰,基于传统算法的高分影像的建筑物提取结果普遍存在着精度不够、边缘缺失等缺陷,因此,高精度的高分影像建筑物自动提取模型亟待开发。近年来随着硬件设备的大幅进步以及大数据时代的到来,深度学习算法得到了前所未有的快速发展。深度学习算法在图像处理方面具有准确性高、鲁棒性强等优点,基于深度学习的高分影像建筑物自动提取方法可以达到更高的精度。本文总结和分析了国内外在高分影像建筑物提取方面的相关研究,阐述了深度学习卷积神经网络的建筑物提取方法原理。为进一步提高建筑物语义分割的精度,提出了一种基于轮廓特征的多任务学习语义分割网络,并且,为同时获取高分影像中建筑物的掩膜和包围框提取结果,提出了一种基于实例分割的高分影像建筑物提取方法。本文的主要工作可以总结为以下几点:(1)分析了经典的语义分割模型原理与结构,主要包括FCN、U-net以及ResUnet模型。考虑到建筑物对象所具有的独特轮廓特征,提出了一种基于轮廓特征的多任务学习网络。该模型借助多任务学习思想,可以同时使用影像的局部信息与全局信息,在进行建筑物分割任务时添加轮廓特征提取辅助任务,从而利用轮廓特征约束和调节分割模型的参数,提高建筑物边缘提取精度。(2)分析了深度学习目标检测方法与语义分割方法的区别,详细介绍了RCNN系列算法的原理,重点分析了Faster RCNN模型的结构与原理。并利用Faster RCNN模型实现高分影像建筑物的目标提取。(3)在语义分割与目标检测的基础上,提出一种基于实例分割的建筑物提取模型,进而提高建筑物提取模型的实用价值。采用Mask RCNN模型提取高分影像中的建筑物目标,同时输出建筑物对象的分割掩膜与目标包围框信息,并且,将两种输出结果分别与上述语义分割结果及目标检测结果进行精度比较。本文收集整理了五种建筑物高分影像数据集,并对数据进行了相应标注生成及样本扩充,用于建筑物提取模型的训练及测试。在相同测试集上的实验对比表明,本文提出的基于轮廓特征的多任务学习网络分割模型显著优于经典的U-net系列语义分割网络。基于Mask RCNN的建筑物实例分割模型在目标检测结果上明显高于Faster RCNN模型,并且能够同时输出语义分割与目标检测提取结果,进一步提高了模型的实用价值。