论文部分内容阅读
近年来,人工智能技术在科学研究和实践应用中得到广泛发展,知识图谱相关技术作为人工智能的重要课题也得到迅速发展。知识图谱数据如雨后春笋般在各个领域中涌现,单个公开可用的知识图谱数据量已经包含超过百亿条事实,这些单独的数据源又互相连通,从而形成了数以百亿计的超大规模的知识图谱。在此背景下,高效地服务这些超大规模知识图谱数据已经成为当前知识型应用的紧迫任务。此篇论文中,本文主要研究大规模知识图谱的服务,涵盖从系统到应用的范围如下:1.本文首先介绍已有的为超大规模图数据和知识图谱设计的图系统。图数据因其结构上的异构性和联系的丰富性天然很难管理和处理,这种情况在图数据量大时尤甚。作为一种特殊的图,知识图谱数据又因其特点给高效服务引入了更多的挑战。本文将分析大规模图数据和知识图谱数据管理时的挑战,进而本文总结了通用图系统和知识图谱管理系统的设计指导。2.本文将介绍一种为大规模知识图谱数据提供服务的强类型管理系统Stylus。本文提出,强类型的存储模型是为大规模知识图谱数据提供高效服务的关键。但是由于知识图谱数据表示的灵活性,为其设计一个类型系统并非易事。Stylus采用了一种强类型的存储模型来实现非常高效的大规模知识图谱数据的管理。其所定义的类型来源于所需要提供服务的数据,同时,一个新的数据结构也被提出来进行数据建模。在此存储模型之上,本文创新采用了基于子图的查询处理策略,使得Stylus可以为大规模知识图谱数据提供几乎实时的服务。3.针对知识图谱中的关系发现任务,本文提出了基于语义导航的方法来高效寻找实体之间的关系。语义导航利用知识图谱的分布式表示来指导导航过程,使得找到的路径既短且有意义。本文融合了机器学习的方法来降低该问题中搜索的复杂度。本文依次提出了多种语义导航方法。本文首先介绍一种直观的基于语义相似度的导航方法。进而提出了一种基于价值网络的神经语义导航的方法来提升效果。为了解决这些导航方法可能找不到相连路径的问题,本文进一步提出了一种改进的蒙特卡罗树搜索方法。实验证明,这些语义导航方法既有效又高效。