论文部分内容阅读
知识推断,即根据知识图谱中已知知识,推断出更多新知识,以提高知识图谱的完备性。当前主流的方法主要分为两类:1)基于表示学习的方法,该类方法是将知识图谱中的实体和关系映射到低维连续向量空间中,然后在该向量空间中进行推断;2)路径排序算法,该类方法利用连接两个实体间的路径,去推测两个实体间可能存在的关系。本文着重考虑如何将路径上下文更好的应用在两类工作中,并提出了如下解决方案: 1.融合路径上下文的表示学习知识推断方法 目前已知的知识推断表示学习方法,大多是对三元组单独建模,忽略了若两个实体通过同一个实体相连,则这两个实体之间可能会有某种联系的事实(即实体间跨三元组的联系)。在本文中,将三元组内部直接相连的关系模式,称之为局部链接模式;将跨三元组的联系,称之为路径上下文。针对目前的工作只显式建模局部链接模式,而忽略路径上下文的现象,本文提出了融合路径上下文的表示学习知识推断方法。该算法是一个两步学习框架:在算法的第一步,用知识图谱中抽取出的路径,描述路径上下文,继而通过基于神经网络的语言模型,显式建模路径上下文;在第二步通过现有知识图谱表示学习方法,微调第一步学习到的实体和关系的表示,显式建模局部链接模式。从而使学习到的实体和关系的表示中,同时包含路径上下文和局部链接模式,更精确的进行知识推断。在两个公开数据集上的实验结果表明:本文所提出的算法能够在链接预测、三元组分类和实体分类任务上显著优于目前已有的最佳方法。 2.基于共享上下文路径排序的知识推断方法 路径排序算法是知识推理的一个重要研究方向,它能够很好的捕捉路径上下文。目前路径排序算法针对每一种关系类型,构建单独的分类任务,未考虑当任务相关时,路径上下文可以在任务间共享的情况。为了最大化利用路径上下文,本文提出了基于共享上下文路径排序的知识推断方法。该算法旨在充分利用路径上下文信息,使得当任务相关时,将路径上下文在任务间共享,进而提升路径排序算法的效果。该算法首先通过层次聚类发现任务之间的相关性,然后通过多任务学习将路径上下文在任务之间共享。实验表明了路径上下文在相关任务之间共享的有效性。