基于实体描述和关系路径的知识图谱补全研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:zx20060522
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模的知识图谱用于存储现实世界中实体和实体之间关系的复杂结构信息。知识图谱最初目的是用于改进搜索质量、提升搜索效率,广泛应用在智能搜索、智能问答等领域。知识图谱中包含大量由实体和实体之间的关系构成的事实三元组,但是目前在大规模的知识图谱中由于数据的稀疏性,知识是不完备的,有许多隐含的知识还没有被发掘出来,需要进行知识图谱的补全任务。最初知识图谱补全是利用基于逻辑规则的方法进行知识推理,采用一阶Horn子句或一阶逻辑的方式预测实体之间的关系进行知识图谱的补全。但是基于逻辑规则的方法中推理规则需要人为进行编写,效率较低。最常用的知识图谱补全方法是基于翻译转换的方法,基于翻译转换方法的思想是将知识图谱中的实体和实体之间的关系嵌入到一个连续低维的向量空间,保留了原图中一定的关系属性,通过学习实体和关系的向量化表示来完成知识图谱的补全。基于翻译转化的方法计算简单且容易操作,特别是在稀疏图中表现出很好的性能。但是基于翻译转化的方法依靠纯粹的数据驱动,预测结果的准确率受到一定的限制。还有一类比较常用的补全算法是基于关系路径的方法,这类方法根据知识图谱有向图的特性利用随机游走的方式计算实体之间关系存在的概率进行知识图谱的补全。基于关系路径的方法能很好的解释预测的结果,相比基于翻译转化的方法有更优秀的性能。但是这类方法在数据稀疏的知识图谱上无法表现出良好的性能,而且提取关系路径计算消耗较大。在本文中,我们提出一种新的知识图谱补全算法。首先,我们的方法充分利用知识图谱中实体的文本描述信息,将文本中词语向量组合后对文本进行向量表示用以代表实体。其次,我们的方法结合知识图谱中实体之间的关系路径信息,用知识图谱中的路径信息加强对实体之间关系的表示。我们结合文本描述信息和关系路径信息推导出知识图谱三元组的相似性度量函数,算法采用基于间距的损失函数对数据集中正例和负例数据进行分割再进行优化计算,使用批量随机梯度下降法训练算法得出实体和关系的向量表示。最后,我们以实体和关系的向量表示来完成知识的语义计算,完成知识图谱的补全任务。我们的方法充分利用了知识图谱的特征,结合知识图谱中大量实体之间的关系路径信息和知识图谱中对实体的文本描述信息,利用这些有价值的信息将实体和关系嵌入连续低维的向量空间,进行实体和关系的向量表达从而完成知识图谱的补全任务。最后,我们的算法在标准实验数据集上通过实体预测、关系预测等评测标准上进行实验结果对比分析,证明了我们的算法的可行性和有效性。
其他文献
<正>正值共青团改革的重要时期,株洲青联结合自身实际,不断开拓创新,规范从严治会流程,进一步深化青联改革。努力增进各族各界青年的共同理想信念,不断增进广大青年对中国特
Akirin基因家族在骨骼肌发育上具有重要作用。该基因家族有两个成员,Akirin1和Akirin2,研究报道鸟类基因组仅含有一个成员Akirin2。为研究鸟类Akirin2基因的功能,在鸭成肌细
化学工业可以促进经济发展和满足人类多方面多角度需求,但与此同时也带来了不可忽视的环境污染,各种污染问题和中毒事件的屡屡出现在很大程度上制约了我们的生活质量。针对当
目的探讨在Superpath人工全髋关节置换术中应用氨甲环酸静脉联合关节腔内注射后引流管夹闭时间对术后失血量的影响。方法筛选出75例符合诊断及排除标准的患者随机分为A、B、C
【正】 一中国是一个文明古国,语言文字的学习研究也相当兴盛。秦汉时期教习儿童的识字课本很多,有李斯的《仓颉篇》、赵高的《爰历篇》、胡毋敬的《博学篇》、司马相如的《
用拉伸实验冲击实验研究了聚甲基丙烯酸甲酯,聚苯乙烯等有机刚性填料对聚氯乙烯韧性的影响,实验表明PMMA、PC对PVC具有一定的增韧作用,并且其增韧机理与性体增韧不同。
天然产物具有多种生物活性,如抗氧化、抗肿瘤、抑菌、除草活性等。具有除草活性的天然产物大多数是在植物次生代谢过程中产生的,主要包括萜类、黄酮类、生物碱类等。研究这些
【正】 “杨”和“柳”,是同科异属之木,古代诗文中二者常常通用。明李时珍《本草纲目&#183;木二&#183;柳》:“杨枝硬而扬起,故谓之杨。柳枝弱而垂流,故谓之柳。盖一类二种也
黄石市1993年8月至2001年12月实施世界银行贷款结核病控制项目,项目执行期为8年.……
期刊
叙述了PA/ABS塑料合金的制造方法。PA/ABS塑料合金的商品化只是近几年在国外才见有报道,PA与ABS之间相容性较差,因此在制造时必须加入相容剂。此外,还需加入弹性体,以改善PA/ABS塑料合金的冲击韧性。本文