基于表示学习的知识图谱实体对齐研究与系统实现

被引量 : 0次 | 上传用户:mrchangmeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱是基于人类知识构建的结构化知识库,随着互联网以及人工智能技术的发展及迫切需求,目前已经有大量的知识图谱诞生,这些知识图谱被广泛应用于智能知识问答、智能推荐等人工智能领域。各种知识图谱数量的快速增长促进了知识图谱融合技术的研究,知识图谱的表示学习及实体对齐方法作为这一任务的关键技术,成为近几年的研究热点之一。受限于标注数据的数量,现有方法更多的是考虑使用辅助信息去提升实体的向量表示能力,例如字符串信息、实体属性信息。但对于跨语言多模态这类符号异质性的知识图谱,辅助信息难以在统一的表示空间下建模,导致上述方法普适性较差。基于这一问题,本文提出了结合表示学习及概率推理的实体对齐方法,构建了弱监督情况下多源异构知识图谱的融合模型,并开发实现了一个在线知识图谱融合系统,本文研究成果如下:(1)通过对知识图谱中的实体与关系进行分析,发现知识图谱中关系类型数量和实体数量存在着巨大的差异。本文基于这种差异,使用表示学习方法获得相似关系,基于实体种子对齐(已标注对齐的实体)及相似关系,设计出概率推理实体对齐方法。结合模型中概率推理模块与表示学习模块的实体映射输出,得到最终的实体对齐结果。最后,通过在多个数据集上进行的对比实验,证明了该实体对齐方法的优越性能。(2)在建模知识图谱间相似关系的基础上,进一步分析了多源异构知识图谱中存在的独有关系,发现这些关系往往是导致知识图谱间结构差异问题的原因之一。基于此,本文使用表示学习筛选出独有关系,将这些关系进行修剪以减轻独有关系造成的结构差异问题。与此同时,针对知识图谱初始标注数据不足的问题,本文使用半监督的方法在多次迭代中不断丰富实体种子对齐与相似关系,进一步的提升模型中各模块性能。最后,在相同的数据集上,所提模型取得了更佳的实体对齐效果。(3)基于以上研究成果,实现了一个在线知识图谱融合系统,允许个人用户上传多源异构知识图谱,供系统在后台对知识图谱进行融合。融合完成后用户可在线查看知识图谱结构,并下载融合后的知识图谱文件。
其他文献
学位
学位
学位
学位
学位
知识图谱用来描述现实中实体和实体间的关系,形成了一个内容丰富的语义网络图,其中节点代表实体,边代表关系,结构化地表示(头实体,关系,尾实体)形成的事实三元组。受现阶段信息抽取技术发展水平的限制等诸多原因,知识图谱仍处于一个不完备的状态。为了充分挖掘知识图谱潜在知识,对知识图谱进行补充和完善,需要研究相关的知识补全工作,知识图谱补全旨在发现充分表达实体和关系语义关联的模型,从而依照三元组中的已知实体
学位
学位
学位
学位
学位