论文部分内容阅读
随着大数据时代的到来,知识的存储与表示变得尤为重要。知识图谱是知识表示最有效的方式之一,被广泛的应用于智能搜索、智能问答等智能化应用。虽然,现有知识图谱的规模已经十分庞大,但其距离达到知识的完备状态依旧十分遥远。知识图谱的完备程度将直接影响智能化应用的性能好坏。为此,知识图谱补全技术备受关注,已经成为当前的一个研究热点。知识图谱嵌入旨在利用连续的、稠密的、低维的向量来表示知识图谱中的实体和关系,以便使用低维向量进行知识的推理和补全。近年来,基于翻译的模型表现出强大的可行性和鲁棒性,在知识图谱补全任务中实现了最先进的性能。但是现有翻译模型仍存在知识表示不够精确、负例三元组质量较低等不足,为了克服这些不足本文提出了MvTransE与TransE-SNS模型。本文主要研究内容如下:(1)本文提出了一种多视角学习的嵌入模型MvTransE。该模型先从实体的语义和结构角度生成多个平行子图。然后将原始的知识图谱和子图分别嵌入到全局视角空间和局部视角空间。最后利用多视角融合策略整合关系事实的多视角表示。MvTransE解决了现有模型的两个不足之处。第一,TransE、TransH等模型侧重于从全局出发,学习关系事实的全局表示,这样不能区别地学习各种类型的事实。特别是,它造成实体和关系在向量空间中的拥塞,从而降低了实体和关系向量的表示精度。第二,puTransE采用多个平行空间来学习局部事实,它损害了原始知识图谱的全局事实,从而降低了简单关系事实的学习能力。大量实验结果表明,MvTransE取得了最先进的性能。(2)本文提出了一种相似性负采样策略用于生成高质量的负例三元组。该策略先通过K-Means聚类算法将所有实体划分为多个簇。然后从正例三元组中头实体所在的簇中选择一个实体替换头实体,并以类似的方法替换尾实体。我们将相似性负采样策略与TransE相结合得到TransE-SNS。由于相似性负采样策略解决了TransE在训练中会生成大量的低质量负例三元组问题,提高了负例三元组的质量。大量实验结果表明,TransE-SNS的性能相较于TransE具有显著地提升。