论文部分内容阅读
知识库以三元组构成的网络形式存储现实世界的事实表达,是诸多下游人工智能应用(智能搜索、智能问答、个性化推荐等)的基石。随着知识库规模的不断扩张,基于网络的符号表示在计算知识库的语义和知识推理的过程中面临计算复杂度高、可扩展性差等问题。知识表示学习被提出来解决这些问题,并受到了学术界和工业界的广泛关注。它旨在将实体和关系映射为低维稠密向量,从而可以完善地保留知识库内部的结构,并在低维空间中高效地计算知识库的语义和完成知识推理的操作。现有的知识表示学习方法主要在拟合知识图谱中单个三元组内部的交互模式,忽略了图结构信息。图结构信息能够挖掘出知识库更丰富的交互模式,更深入且全面地刻画知识库中实体和关系的语义。因此,研究融合图结构信息的知识表示方法具有重要的现实意义。本文从不同的图结构信息入手并进行了系统性的研究,探索了融合各种图结构信息的知识表示学习方法。本文研究的主要内容可概括如下:·提出了一种基于相邻节点信息的知识表示学习算法。针对相邻节点信息,我们探究利用语言模型的思路,来对实体与其相邻节点之间的共性关系进行建模,从而抽取相邻节点信息中蕴含的结构等价性。最后,我们设计了一个联合知识表示学习模块来融合三元组本身内部具有的交互信息和实体的相邻节点信息。·提出了一种基于多步关系路径信息的知识表示学习算法。为了利用实体对之间的多步关系路径来提升实体对之间的直接关系的表示性能,我们通过改良长短期记忆网络来利用关系路径上实体和关系的信息对直接关系进行语义建模。针对实体对间的多条多步关系路径,我们引入了一种缓和的注意力机制来学习多条多步关系路径对应的语义关系与直接关系的一致性程度。此外,为了缓解知识图谱的稀疏性问题,我们抽取了大量的文本关系来扩充知识库关系集,并构建了一个更完整的知识图谱数据集。·提出了一种基于三元组上下文信息的知识表示学习算法。为了更全面地对三元组的图结构语义进行建模,我们将实体的相邻节点信息和实体对之间的多步关系路径信息定义为三元组上下文信息。考虑到三元组上下文信息中不同语义的独特性,我们设计相应的知识表示学习策略来学习三元组的图结构语义表示。同时,我们提出了一个统一的框架来融合三元组本身内部的交互信息和三元组上下文信息。·提出了一种基于图节点上下文信息的知识表示学习算法。为了更好的刻画实体的图结构语义,我们不仅考虑实体的相邻节点信息,同时也将实体的相邻边信息纳入考虑之中。这两种信息的结合就是图节点上下文信息。针对图节点上下文信息,我们设计了创新性的图卷积神经网络,来构建实体的图结构语义表示。此外,我们针对实体分类和知识图谱补全任务,设计了相应的解码器。我们在知识图谱补全、三元组分类、实体类型分类等知识表示学习经典任务上,对提出的模型进行了性能测试。实验结果表明,基于图结构信息的知识表示学习方法较其他经典的基线模型效果增长显著,也说明了图结构信息中蕴含的丰富语义能够更好地建立知识表示。此外,基于图卷积神经网络的知识表示学习模型较其他基准模型在少样本知识图谱补全任务上取得了更好地实验效果,说明图卷积神经网络能很好地对图结构语义建模。