注意力机制下融合全局和局部深度特征的建筑立面语义解析

来源 :南京林业大学 | 被引量 : 0次 | 上传用户:zjt518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
建筑物作为城市中最基本、最主要的组成元素,其三维模型在室内外导航、建筑能耗模拟、三维可视化、建筑抽象等领域有着广泛的应用。由于激光雷达技术可以捕捉到建筑屋顶和立面部件的复杂结构,如窗户、门、阳台等,点云被大量用于三维建筑真实场景的增强。然而,如何以精确的几何、正确的拓扑和丰富的语义来重建点云的建筑模型,以实现语义理解和几何表示仍然是一个重大的挑战。与识别建筑屋顶部件相比,解析建筑立面部件,如窗户、门、阳台等是极具挑战性的,因为立面部件的复杂性(类型多样化的窗户和门,不规则的排列等),以及立面点云通常存在异常值、不规则性和遮挡和自遮挡造成的数据缺失等问题。近年来,深度学习在处理点云语义分割任务展现了很好的性能,这类方法相较于传统人工设计特征提取算子方法分割精度更高,因此利用深度学习处理建筑立面点云数据具有重要研究意义。由于从不平衡的类别数据中进行特征提取仍然是点云语义分割任务中一个具有挑战性的问题,以及目前缺乏大规模城市建筑物部件分割尺度上的点云标注基准数据集使得实现深度学习分析和理解三维城市建筑存在困难。为此,本文首先在Dublin城区建筑物点云数据集的基础上建立了一个大规模、标注准确且部件标注丰富的建筑在部件尺度上的三维点云建筑立面数据集,以便于利用点云深度学习算法自动化语义分割建筑物立面。其次,本文提出了一种基于建筑立面点云实施门窗小部件语义分割的深度学习框架AFGL-Net,提升不均衡类别门窗小部件的语义分割精度。针对AFGL-Net框架,本文首先设计了顾及方向和位置编码的局部特征编码,强化局部特征聚合,增强门窗边界点的边缘特征和立面点的局部特征。其次,AFGL-Net中融入了全局Transformer感知模块,捕获门窗上下文全局特征,推理建筑立面门窗的几何位置结构和结构布局,能够将边缘特征不显著的门窗从密度变化不均、含有噪声和离值点且数据缺失的建筑立面点云中正确识别。最后,基于注意力机制融合全局和局部特征,其融合特征能够更有效地表达出立面门窗的几何结构,均衡Transformer所带来的门窗提取Commission分割错误。本文使用Dublin和Rue Monge2014语义标注数据集通过消融实验、对比实验和鲁棒性实验验证了AFGL-Net的有效性。在两个数据集上AFGL-Net预测语义分割精度m Io U分别为67.02%和59.80%,均优于当今主流深度语义分割框架。
其他文献
学位
报纸
学位
学位
学位
学位
学位
学位
学位
学位