论文部分内容阅读
随着互联网的发展,出现了很多具有复杂关系的数据,传统的数据库很难处理复杂关系运算,知识图谱是事实的结构化表示,存储了大量的实体及其实体之间的关系。知识图谱已经被广泛应用于对话系统,问答,推荐系统等任务与应用,然而现有的知识图谱存在着不完整以及稀疏性问题,知识图谱缺失数据会严重影响上层应用的效果,因此对缺失三元组的知识图谱进行补全是非常有意义的。知识图谱补全大致分为两种方法,一种是封闭世界知识图谱补全,通过知识图谱中的已有数据,发现实体之间新的关系。另一种是开放世界知识图谱补全,通过新的数据来获得新的事实,将新的事实加入知识图谱中以进行知识图谱补全。因此本文针对这两种不同的知识图谱补全技术进行了研究。1.现有的封闭世界知识图谱补全,使用知识表示学习方法将实体和关系嵌入到低维向量空间,获得实体和关系的向量表示,再进行知识图谱补全。然而传统方法存在忽略了图结构的信息、没有充分捕获实体嵌入和关系嵌入之间的交互作用、关系嵌入没有参与进图神经网络的训练等问题。针对以上问题,提出了一种基于RWGCN与CNN的知识图谱补全方法。该方法首先利用关系特定的加权图卷积网络(RWGCN)获得实体嵌入;然后将实体嵌入与关系嵌入通过一个权重矩阵进行融合,随后使用3D循环卷积进行特征提取;最后特征向量通过内积与所有候选实体向量嵌入匹配。在FB15k-237和WN18RR数据集上进行了大量实验,实验结果表明,本文的模型比已有的方法取得了更好的效果。2.传统的开放世界知识图谱补全方法,实体的基于文本的嵌入没有学习实体文本描述的上下文信息,并且不能充分表示实体。针对以上问题,提出了一种基于BERT与注意力机制的开放世界知识图谱补全方法。通过预训练BERT模型对实体名称与文本描述组成的单词序列进行编码,并使用注意力机制进行聚合得到基于文本的嵌入表示。然后使用MLP结构作为映射函数,将基于文本的表示映射到基于图形的嵌入空间,从而使用封闭世界知识图谱补全模型进行补全。通过实验表明,与现有开放世界知识图谱补全模型相比,本文的模型均取得了良好的实验结果。