论文部分内容阅读
近几十年来,中国不断加大基础建设的力度,道路网络体系快速扩展。为了实现国民经济和社会发展的科学决策,迫切需要及时获取路网分布状况的信息。使用超高分辨率图像提取城市,郊区和乡村道路具有重要的应用价值。然而,高分辨率影像中提取道路通常涉及两个难点。首先是保持道路路面的完整性和边线的平直度。道路两侧的大型树冠、高大建筑物具有阴影效应,常常遮蔽道路路面,造成路面提取上的困难。其次是保持区域内道路网络的连通性,使道路网络无缺失、不中断。有效地提取路旁树冠或高层建筑物所遮蔽的道路区域,以维持所提取的道路区域的完整性,边线的平滑性和路网的连通性仍然存在挑战。以往基于像元的分析、基于对象的分析中难以解决这一问题。针对以上问题,本文通过在Dense UNet框架中嵌入两个注意模块,即全局注意和核心注意模块,并构建了一种新的语义分割网络模型,即级联注意力的Dense UNet语义分割模型(Cascaded Attention Dense UNet,以下简称CADUNet)。首先,引入了一组级联的全局注意力模块,以获取道路的全局信息,进而提高树冠、高层建筑物阴影下道路联通性和路面完整性。其次,嵌入一组级联的核心注意模块,以确保道路信息在网络中的密集块中得到最大程度的传输,并进一步协助全局注意模块获取更多的有效道路信息,从而改善路网的连通性。另外还可以恢复由树冠和高层建筑遮挡、停车场内部道路、交通枢纽等的道路区域的完整性。在二元交叉熵的基础上,提出了一种自适应损失函数,用于网络参数的调整。本文使用了两组公开的遥感影像数据集为研究对象,马萨诸塞州道路数据集和Deep Globe-CVPR 2018道路数据集(以下简称CVPR道路数据集),在超算中心的硬件、软件支持下进行实验。最后本文的研究结论如下:(1)从多方面的定性分析对比中得出结论,本文模型适用于农村、郊区、城市的道路提取,性能优于其他对比模型。同时本文模型可以有效的提升路面完整性、边线平直度以及路网连通性,得到的道路提取结果中断少。本文模型较好地解决树冠、高层建筑等阴影遮挡道路的问题。(2)在两组公开的遥感影像道路数据中的定量分析结果中,本文模型均优于其它模型。在马萨诸塞州的数据集中,CADUNet的F1得分和Io U分别达到了77.89%和64.12%;CVPR数据集中CADUNet的F1得分和Io U分别达到了76.28%和62.08%。通常,CADUNet在CVPR数据集中的性能劣于在马萨诸塞州数据集中的性能,这可能是由于CVPR数据集的标注错误比较多,影像空间分辨率较高,学习起来比较困难。从结果看,几种模型的总精度普遍达到较高的取值,彼此差异不大,总精度对道路提取精度的评价功效有限,而F1得分和Io U综合了查准率和查全率两个指标,因此道路提取的精度评价相对有效的指标是F1得分和Io U。(3)本文对多种道路类型上的提取结果进行了性能的视觉准确性评估,发现在多种道路类型的提取结果上,本文方法具有先进性,但是在实际应用中会受到训练数据集标注质量的影响,对于部分乡村、郊区、城市道路无法准确的识别出来。(4)在中卫市的World View-II、World View-III影像的模型迁移实验结果中,基于两个公开数据集训练好的CADUNet均具有一定的泛化能力,但是模型泛化能力在不同空间分辨率的影像上存在较大差异。在没有进行影像融合的World View影像迁移实验中,可以发现影像空间分辨率低于模型训练数据的空间分辨率时,两个模型的总体道路提取效果均不佳,泛化能力较弱,两者存在各自的各有优缺点。基于马萨诸塞州数据集训练好的CADUNet在细长道路上表现较好,而基于CVPR数据集训练好的CADUNet在大型道路上表现较好。在进行了影像融合后的World View影像迁移实验中,基于CVPR数据集训练好的CADUNet的模型迁移结果可以说明,模型训练数据与模型迁移后数据的空间分辨率一致时,模型的迁移效果较好,泛化能力较强,路面完整性高,但是结果仍有改善空间。基于马萨诸塞州数据集训练好的CADUNet结果说明,当模型训练数据与模型迁移后数据的空间分辨率不一致时,模型的道路提取效果较差,存在大量“漏提”现象,且提取出的路面完整性不高。(5)通过模型的可视化方法进一步了解了本文模型解决树冠遮蔽效应问题的工作过程。模型可视化中,从编码器到解码器逐层输出特征图,通过观察每层的特征图结果,可以发现在编码器阶段的第1个密集块中已经开始学习被遮蔽道路的低级形状、纹理特征。第2和第3个密集块继续学习并得到该道路的特征图。最后一个密集块中呈现的为高级语义特征,无法直接解译特征图的含义。解码器阶段,从第二个级联注意力模块开始,可已经以看到经过注意力模块后的特征图中出现了该遮蔽道路。随着解码器对特征图解译的深入,该道路与周围背景信息两极化逐渐明显。最终预测图中可以看出,该遮蔽道路的提取效果较好。