论文部分内容阅读
随着信息时代的来临,地质大数据面临着数据量巨大,挖掘效率低等问题,以知识驱动的地质领域大数据分析方法和理论研究是当代地学知识研究的战略重点,知识图谱作为一种新的知识表示形式,可以有效地组织和表示地质大数据。本文提出了以矿床为本体构建地质知识图谱的方法,矿床作为地质作用的综合产物,其成矿物质及其来源、成矿环境和成矿作用等要素所涉及的知识涵盖了大部分地质学研究内容,以矿床为单位构建知识图谱可以全面而系统地将地质数据进行组织和开发。基于此,本文的主要研究内容以及成果如下:(1)本文提出矿床知识图谱从“矿床预测模型-典型矿床”两个部分进行矿床本体构建;依据成矿地质体、成矿结构面与构造、成矿作用标志特征的“三位一体勘查区找矿预测理论”进行矿床本体的知识定义;并按照“自顶向下,自底向上,分部交汇,逐级分层”的思想进行矿床知识表示,从更深层次上展现矿床成矿特征的整体性与差异性。(2)采用标注的矿床数据集训练了基于Bert-Bi LSTM-CRF的矿床实体抽取模型,以及基于Bert的关系抽取模型,实现矿床知识图谱三元组的智能抽取;并基于所构图谱开发了矿床知识图谱管理系统,实现矿床知识的可视化展示、地质要素分析、地图空间索引等功能,为检索矿床知识提供便捷的信息服务。(3)本文以甘肃寨上-马坞金矿集区为研究区,构建了研究区基础地质知识图谱,以及矿区内马坞金矿、寨上金矿、李坝金矿、锁龙金矿、鹿儿坝金矿、新庄里金矿、郭家沟金矿、桦林沟金矿、竹子沟金矿9个典型金矿的知识图谱,并基于所构建的知识图谱,采用基于Cypher语言的分析语法,对研究区的矿床进行成矿特征分析与比较,为矿床综合分析与评价提供了新的视角与方法。(4)基于知识图谱“实体-关系-实体”的三元组表示,融合中心性算法、社区检测算法以及相似度算法对研究区找矿线索进行了详细的总结与分析;研究并实现了将矿床知识图谱与图像分类技术相结合的找矿预测方法,将知识图谱三元组以向量化的形式为地质图赋予语义信息,并嵌入卷积神经网络中进行找矿预测,取得了良好的实验效果。