论文部分内容阅读
随着互联网技术的快速发展,海量信息被发布在网络上,我们来到了信息大爆炸的时代,信息背后隐藏着丰富的知识,知识可用于很多领域的决策支持。知识图谱以更接近人类认知世界的方式在互联网上表达信息,为知识的组织、计算以及应用奠定了非常重要的基础。如何从大规模知识图谱中高效地获得更深层次的隐含知识是重要的研究课题,其主要包括两个方面:知识的构建与获取。由于目前相关的研究工作都是基于离散的符号化表示,无法进行大规模且高效的计算,另外也无法利用隐含的语义信息,因此提高知识构建与获取的效率和质量,面临着巨大的挑战。本文提出了基于知识图谱表示学习技术的知识构建和获取的方案,利用表示学习技术将符号化的知识表达为连续的低维稠密实值向量。将语义关系转换为向量空间中的数值计算。首先,本文提出了知识构建方法及普适性框架OWLearner,用于在知识图谱的数据层面之上构建本体层,即模式层,用OWL本体来描述抽象的知识,本文共学习了 12个OWL本体公理的模式,提出了训练样本的获取方法以及特征的构造方法。其次,本文提出了知识获取的方案,主要解决了SPARQL查询在没有精确解的情况下进行解推荐的问题,提出了 SPARQL查询的普适性推荐框架TrQuery,给出了查询解析算法、基于语义的打分模型以及推荐算法。最后,设计了大量实验来评估OWLearner和TrQuery的正确性及性能。实验表明,本文提出的OWLearner相比于传统的本体构建方法DL-Learner,在效率和本体质量上都得到了提升,另外,TrQuery无论在时间效率还是排序质量上都优于传统方法SAPPER。综上所述,对于在知识图谱上的知识构建和获取,本文提出了基于表示学习技术的适应性知识构建框架OWLearner以及知识推荐框架TrQuery,这两个框架均可以有效且高效地处理大规模知识图谱。