论文部分内容阅读
知识图谱最核心的技术之一就是知识图谱的推理技术,是由已知的事实推理出未知的结论的过程。近年来,随着知识图谱规模的迅速增长,知识推理技术成为了当前研究的热点。链路预测知识推理技术的重要分支。研究人员发现,在应用于链路预测的多种算法中,随机游走算法具有逻辑简单、易于实现等优点。知识图谱补全也是知识推理技术的重要分支。现实世界中的知识图谱通常非常不完整,因此需要进行知识图谱补全。基于随机游走的路径排序算法(PathRanking Algorithm,PRA)是完成此任务的最有效的方法之一本文从基于随机游走的多关系网络链路预测、随机游走算法优化、基于PRA的知识图谱补全3个方面进行研究,主要工作有以下3点:(1)针对现有的链路预测主要集中在单一关系网络,忽略了关系之间影响力的问题,提出了基于多关系网络的随机游走链路预测算法。该算法计算每个关系中所有节点之间的相似度,然后将所有其他关系中两个节点之间的相似度的和定义为每个链路边缘的传播概率。得到传播概率后,在网络中通过随机游动传播和更新节点之间的相似度。最后,通过链路预测得到节点间的相似性。将该算法与多关系网络中的其它链路预测算法进行了比较。实验结果表明,该算法比其他多关系网络算法具有更高的预测精度。(2)针对随机游走算法中所有节点都使用相同的重启概率限制了随机游走的表现力,并且需要手动选择重启概率的问题,提出了随机游走扩展重启算法。通过允许每个节点的不同重启概率来反映查询节点对相关性分数的偏好,并且能从给定图表中自动找到最佳重启概率。将提出的方法与其他链路预测方法以及基于随机游走重启的方法进行比较,实验表明,方法能获得更好的链路预测精度。(3)针对目前关于PRA的研究通常只基于单任务学习,通过自己的训练数据独立地为每个关系建立预测模型,方法忽略了某些关系之间有意义的联系,并且可能无法获得足够的训练数据来处理不太频繁的关系的问题,提出了一种新的PRA多任务学习框架,称为Multi-PRA(MPRA)。首先设计了一种凝聚聚类策略,以自动发现彼此高度相关的关系,然后采用多任务学习策略来有效地结合这种关系的预测。实验结果表明,MPRA可以有效地识别关系高度相关的相干聚类。通过进一步耦合这种关系,MPRA在预测准确性和模型可解释性方面明显优于PRA。