论文部分内容阅读
随着工业互联网+的发展,制造业的数字化转型正在如火如荼地进行着。而知识在其中发挥着至关重要的作用,它是许多智能决策、资源优化的基石。但是现在制造业知识分布独立,且许多依靠人的经验。知识图谱近年来大展拳脚,它可以整合不同来源的数据,且拥有很好的推理能力。因此,建立制造业的知识图谱会对制造业的智能化产生推动作用。
现有的知识图谱大多仅存在定性知识,但制造业中存在许多定量知识以及事理知识。因此,本文针对制造业的知识特点,提出面向制造业的知识图谱构建与表示模型。我们从三个方面对制造业知识图谱进行了改进。本文的主要工作如下:
1)将定量知识与定性知识相结合
将定量知识的抽取转化为命名实体识别与属性抽取。在使用序列标注的方法对命名实体进行识别后,本章提出个性化PageRank与Bi-LSTM-CRF结合的方式进行属性识别,无需提前指定属性类别;且与无监督方法相结合,使方法具有可移植性,减少了人力标注的成本。
2)将概念知识与事理知识结合
将事理知识的抽取转化为事件触发词提取、事件描述补全、事件关系分类。使用DMCNN方法对事件的触发词进行抽取后,使用短语句法分析对事件进行补全。本章使用Bi-LSTM方式进行事件分类,无需人工构建特征。不仅针对同一句子中的事件进行分类,且可对跨句子的事件进行分类。
3)定量与事理知识结合,进行联合推理
将知识图谱补全问题转化为排序问题,改进了ProjE算法,将定量知识转化成向量与原“实体”表示相结合,得到最终的知识图谱实体、关系表示。使知识表示不仅针对实体与实体之间的关系,提升了实体链接的能力。
综上所述,本文建立了一个面向制造业的知识图谱,与现有的知识图谱不同。它融合了定量知识、事理知识。且在知识推理时,它的知识表示融合了定量知识的属性知识,不仅只针对实体或事理之间的关系。实验结果表示,我们的方法相比于其他方法效果有所提升。
现有的知识图谱大多仅存在定性知识,但制造业中存在许多定量知识以及事理知识。因此,本文针对制造业的知识特点,提出面向制造业的知识图谱构建与表示模型。我们从三个方面对制造业知识图谱进行了改进。本文的主要工作如下:
1)将定量知识与定性知识相结合
将定量知识的抽取转化为命名实体识别与属性抽取。在使用序列标注的方法对命名实体进行识别后,本章提出个性化PageRank与Bi-LSTM-CRF结合的方式进行属性识别,无需提前指定属性类别;且与无监督方法相结合,使方法具有可移植性,减少了人力标注的成本。
2)将概念知识与事理知识结合
将事理知识的抽取转化为事件触发词提取、事件描述补全、事件关系分类。使用DMCNN方法对事件的触发词进行抽取后,使用短语句法分析对事件进行补全。本章使用Bi-LSTM方式进行事件分类,无需人工构建特征。不仅针对同一句子中的事件进行分类,且可对跨句子的事件进行分类。
3)定量与事理知识结合,进行联合推理
将知识图谱补全问题转化为排序问题,改进了ProjE算法,将定量知识转化成向量与原“实体”表示相结合,得到最终的知识图谱实体、关系表示。使知识表示不仅针对实体与实体之间的关系,提升了实体链接的能力。
综上所述,本文建立了一个面向制造业的知识图谱,与现有的知识图谱不同。它融合了定量知识、事理知识。且在知识推理时,它的知识表示融合了定量知识的属性知识,不仅只针对实体或事理之间的关系。实验结果表示,我们的方法相比于其他方法效果有所提升。