基于嵌入表示的知识图谱实体对齐研究

来源 :吉林大学 | 被引量 : 2次 | 上传用户:JohnWaken19
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着各种知识图谱技术的发展,知识图谱的规模在不断扩大,各领域也纷纷开始根据自身需求去构建新的知识图谱。如今,知识图谱被广泛应用于检索,问答和推理等任务,支撑着许多行业的应用。然而,单一的知识图谱已经不能满足实际的应用需求,而各个知识图谱间又存在信息冗余,异构等问题,因此知识融合成为人们关注的话题。实体对齐是知识图谱融合的重要组成部分,目的是寻找不同知识图谱间指向真实世界同一实体的节点。随着知识图谱嵌入方法的研究深入,基于知识图谱嵌入的实体对齐模型受到人们广泛关注。但是这些模型仍然有不完善的地方:大多数模型只考虑了知识图谱的结构信息对实体对齐效果的影响,一部分模型使用了属性信息提高对齐效果,而实体名称往往被忽视,导致现有的模型对知识图谱上的信息利用不够全面;对于使用了结构信息的模型,目前大多数模型没有考虑中心实体的远距离邻居实体,通常建模中心实体的一阶邻居结构,导致中心实体嵌入表示包含的信息有限。针对这些问题,本文设计了一种基于嵌入表示的实体对齐模型,通过利用知识图谱上的语义信息和结构信息来提升实体对齐的效果。本文模型将知识图谱的实体名称,属性信息和实体类别通过大规模预训练语言模型表示出来,全面利用了知识图谱上的语义信息。另外,本文模型通过将实体的一阶邻居,二阶邻居分别使用图注意力网络建模,实现了更远距离实体信息的利用,使得模型能够捕捉更复杂的邻居结构。本文使用特征线性调制的方法,将词嵌入和结构嵌入进行有效结合。在不同数据集上的实验结果表明,本文模型在实体对齐任务上优于当前已有方法,也体现模型较强的鲁棒性。同时本文设置消融实验验证了各个模块的有效性。在实践中,本文将三个已公开的生物医学知识图谱进行实体对齐,融合成一个更大规模的知识图谱。通过开发知识图谱应用平台,将该知识图谱提供给其他研究人员使用。
其他文献
随着汽车行业的发展进步,汽车已经成了人们出行的主要交通工具。可随之而来的交通拥堵问题与安全隐患越来越严重。而且随着行业的快速发展必然使得未来的汽车保有量持续增高,对于现有的办法,比如车辆限号、扩大交通路网的建设等,无法从根本上解决问题。智能交通系统是一个解决该问题的方案,它是将多领域的先进技术紧密结合,加强车、路、人之间的联系,使交通系统更加高效安全。智能网联汽车在其中发挥重要的作用,C-V2X是
学位
生物体分子之间相互作用是一种复杂的生物机制,涉及到生物学中许多分子之间的非线性动态关系。如何更好地整合这些不同分子之间的复杂关系是一个具有挑战性的问题。lncRNA与miRNA是两类非常重要的非编码RNA,lncRNA是长度大于200个核苷酸的非编码RNA,另一方面,目前99%以上的lncRNA功能未知,这与lncRNA重要的生物医学价值之间存在着巨大的矛盾,如何快速推断lncRNA功能是当下生物
学位
随着虚拟现实(VR)和增强现实(AR)技术的发展,沉浸式数据分析已成为一个快速发展的研究课题。3D节点链接图是在这种沉浸式环境中呈现信息的基本可视化图形之一。然而,却很少有关于在沉浸式环境中研究3D节点链接图的权值编码方式和布局方式。针对加权图中的权值编码,一种直观的方法是在对应的链接旁边显示对应的权值数字标签,但这种方法由于加入了很多额外的信息标签,因此可能会导致较严重的视觉混乱。因此,本文探索
学位
<正> 保赤金科广东南海女中医叶荫桐编著 1927年铅印本女中医在过去历史上是不很多见的,根据《古今图书集成》医部《医术名流列传》的记载,从汉代到明代的地方志里,只载有三个有姓无名的女中医的简略事迹。清代末叶,妇女公开学医的机会才比较多起来。可是,有许多女中医的姓名,在一般医学史里,也还是很少提到的。如本书的作者叶荫桐女中医帅就很少有人知道(因她在上海开业,广东人很少知道)。
期刊
<正> 《福建中医葯》七卷一期发表了好几篇有关辨証論治的文章,这是很好的。辨証論治是祖国医学的精华所在。为了更好地发揚祖国医学,对它作进一步的探討頗有必要。因此我也想談一点关于辨証論治的看法,就正于同道。首先,我認为中医对病名的訂立,共有三个阶段:①以各别“症”状定名,如头痛症、咳嗽症、泄泻症等等;④以“症候群”定名,如桂枝証、麻黄証、阴虛証、阳虛証等等;③由許多“証”再綜合起来,发展为完整的病名
期刊
目的:研究慢性乙型肝炎后肝硬化患者胆囊病变的超声诊断价值。方法:在2016年4月~2020年4月本院接收的慢性乙型肝炎后肝硬化患者中选择50例,设为观察组,另选同期健康体检人员50例,设为对照组,所有人员进行超声检查。比较检查结果。结果:在胆囊壁厚度方面,观察组相关指标比对照组高(P<0.05),在胆总管内径方面,观察组相关数据与对照组比较无意义(P>0.05)。在超声诊断结果方面,观察组相关数据
期刊
暗流云峰铝铁矿位于黔中铝土矿成矿区北部,区域成矿地质条件优越,资源丰富,根据等离子质谱法分析结果显示,矿区内稀土元素含量较贵州省内其他铝土矿区高,可能具有较大的经济价值,本文主要探讨铝土矿及围岩的矿石类型、化学成分、矿物成分与稀土元素含量之间的关系,发现稀土元素含量与粘土矿物含量基本呈正相关性,而白云石、方解石等不利于稀土元素的富集,同时应加大对省内含铝岩系中稀土元素的研究,保证资源的合理利用。
期刊
研究旨在评价不同品种(系)饲用高粱在甘肃临夏半干旱区的生产性能与饲用价值,引进7个不同饲用高粱品种(系),对各品种(系)在当地的生产性能和饲用价值开展研究分析,采用隶属函数法对7个高粱品种进行生产性能和营养品质的综合评价。结果显示:供试品种的株高和节间数均以NX-4264最高,茎粗以陇甜粱2号最粗,有效分蘖数和全株叶片数以海牛最高,主茎叶片数以大卡最高,单株鲜重、单株叶鲜重和单株茎鲜重均以陇甜粱1
期刊
学位
研究目的颅内动脉瘤是一类较为常见的疾病,然而一旦破裂会导致严重后果。目前,对于较大的颅内动脉瘤的破裂风险和治疗策略已有较多公认的研究。但对于小动脉瘤(<7mm)破裂相关因素的研究和治疗策略的研究仍存在争议。研究方法我们通过回顾性研究,筛选了自2016年1月至2019年12月共555例颅内动脉瘤患者,记录并分析了入院时一般临床特征,动脉瘤大小、部位、形状,术后并发症、预后情况等。研究结果入院时平均动
学位