基于图注意力网络的实体对齐算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hackrx123456789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,知识图谱在组织和表示来自不同领域的知识方面起着至关重要的作用,并在各种网络应用中被广泛采用。而单个知识图谱的知识覆盖面毕竟有限,甚至可能会严重影响到下游各种知识图谱应用,如基于知识图谱的问答系统或推荐系统等,所以构建大型知识图谱已经成为一项具有挑战性的任务。虽然可以从零开始提取新的事实三元组,但其成本巨大,而将现有的不完整知识进行整合以相互补充是非常必要的。实体对齐旨在识别不同知识图谱中的等价实体,一直是构建大规模知识图谱的基本问题,仍然远未解决。最近的实体对齐研究多以表示学习技术为主,通过将知识图谱中的实体表示为低维嵌入向量,然后通过计算相似度得到候选对齐实体对。但是如何充分地利用关系信息、如何减少对于标签数据的依赖以及如何利用知识图谱的全局信息仍然是基于表示学习的实体对齐研究中存在的挑战。本文从多重关系的共现问题出发,结合关系的方向信息和关系的对齐信息,对关系和实体的交互进行建模,以更充分利用关系信息。另外,针对标签数据稀少的问题,本文利用稳定婚姻算法改进现有的迭代扩充训练集的方法,用于得到更优的标签数据。基于对这两个问题的分析,本文提出基于关系交互的半监督实体对齐方法。该方法为了更好地表示关系,引入三元图的概念,即通过将三元组中关系表示为节点,针对不同的关系上下文建模关系信息,并以半监督的方式训练得到一个端到端的实体对齐模型,从而得到更准确的对齐实体对。针对基于表示学习的模型对于标签数据的依赖问题,本文还进一步提出一种无监督的实体对齐算法,其通过一个迭代框架结合点集配准技术和基于关系交互的实体对齐模型。通过类比计算机图像中的点集配准任务,并针对当前主流模型中多是建模局部信息为主却没有考虑知识图谱间的全局转换的问题,引入点集配准技术。该算法的直觉是两者分别从全局角度和局部角度考虑实体对齐任务,通过迭代的方式相互增强以达到更好的对齐性能。最后,本文通过在跨语言对齐数据集DBP15K上进行对比实验验证模型的有效性以及消融实验证明其模型不同模块的有效性。
其他文献
视频压缩是计算机视觉领域一项重要的技术,它利用视频和图像的数据冗余特性来压缩数据,从而减轻网络传输和数据存储的负担。然而在对视频进行压缩时会引入压缩噪声,影响了视频的视觉体验,因此需要设计增强算法来去除这种压缩噪声,提高视频和图像的质量。近年来,神经网络技术发展迅速,为视频质量增强提供了新的思路。卷积神经网络CNN利用图像的平移不变性设计了独特的卷积结构和权值共享机制,是图像去噪方法常用的模型结构
学位
目前,医学影像已成为临床实践中不可或缺的工具。随着医学成像技术的巨大进步,医学影像的数据量显著增加,导致医学影像的存储、检索、传输、管理的负担越来越重。有损压缩算法不适用于医学图像,因为有损压缩引入的伪影可能会误导诊断并导致潜在的医疗事故。为了满足对图像保真度的严格要求,无损压缩是医学图像最可靠的选择。当前基于学习的无损图像压缩方法仅关注低动态范围(Low Dynamic Range,LDR)自然
学位
我国经济目前已经开始步入新常态,以往的发展路径如:人口红利,资本积累,出口依赖等发展模式的可持续性存在较大的问题,如果经济需要接着高质量可持续的发展,稳定的增长,提高全要素生产率是我国经济发展的必由之路。一个良好发展的金融体系对企业发展的积极作用是毋庸置疑的,一方面各金融机构能够降低企业融资时面临的摩擦成本,另一方面还能拓展融资渠道:提供各种金融服务与金融产品,对其融资约束的缓解以及其持续经营的支
学位
2005年联合国提出普惠金融一词,其主要含义是有效、全方位的服务于社会的各个阶层人群。同年,我国也引入了普惠金融这一概念,并得到有效推广。随着数字经济和普惠金融的发展,数字经济的便捷性与安全性凸显,数字普惠金融也逐渐成为推动实现经济高质量发展的重要战略导向。绿色发展是中国共产党十八届五中全会提出的“五大发展理念”之一。大力发展环境友好型的产业,通过节能减排的技术措施,实现经济发展与自然和谐共生的经
学位
近年来,房地产行业发展势头强劲,融资规模不断扩大,房地产贷款在银行信贷余额中的占比逐年攀升,使得房地产行业与银行业的联系愈发密切。因而,一旦房地产行业发生危险事件,必定会对银行业甚至整个金融体系的稳定产生不利影响。因此,在国家“牢牢守住不发生系统性金融风险底线”的政策背景下,本文对房地产行业发展及其风险现状进行梳理,对现有研究视角进行拓展,将房地产行业纳入系统性风险管理的框架进行分析,在主流测度方
学位
随着深度学习的迅猛发展,多媒体分析已经取得了长足的进步,如对象跟踪、语义分割等。然而,视频的高级语义理解仍然是一项十分具有挑战性的任务。为了弥合视觉和语言之间的差距、增强多媒体分析系统的可解释性,视频视觉关系检测(Vid VRD)任务应运而生。该任务除了需要预测视频中各个目标的所属类别与运动轨迹,还需要对对象之间的关系进行判定,该关系以<主体,谓词,客体>的形式表示。基于此技术可以快速理解视觉场景
学位
深度学习在机器视觉领域发挥了重要的作用。而在实际应用中,视觉特征的码率成为众多下游视觉任务的基本衡量指标之一,因为这关系到数据传输以及计算的代价。如今,图像不单单面向于人眼,更多时候需要送入计算机来进行分析。针对于面向机器视觉的特征压缩,我们提出了一种基于乘积量化的无监督特征压缩算法并应用于图像检索任务,该方法在图像检索任务检索性能超越了目前最先进的无监督方法。另一方面,如今研究人员提出了许多方法
学位
在药物研发领域,基于病理实验的传统药物开发方式研发周期长、投入成本高,业界一直在寻找有效的计算方法来指导药物研发过程,以深度学习为代表的人工智能技术有改变药物发现过程的潜力。药物小分子一直都是药物研发方和治疗干预的首选方式,在药物开发中占有很大比重。利用深度学习寻找特异性且有效地与靶蛋白结合的药物小分子,能够加速药物研发过程,降低药物研发的成本,在药物研发领域具有重要的应用价值。本文利用图神经网络
学位
在我们常见的网络社群中,社群成员的更具有群体意识、群体归属感,这种情感有时会从线上蔓延至线下,从网络转为现实,也会产生相似的行为。既然情感会引发共同行为,那么在网络社群中,由含有怀旧元素的信息引起社群成员回忆过去、激发怀旧情感,是否也在一定程度上能影响成员一致的购买意愿和行为?所以,本文以网络社群中的青年消费者为目标群体,研究其怀旧情感的产生,心理变化过程,以及如何强化其怀旧情感,继而研究怀旧情感
学位
随着科技的飞速进步,人类展开了更为深入的深空探测活动,深空导航技术也在不断发展的。其中,X射线脉冲星导航方法得到了越来越多的重视,而精准的脉冲星辨识作为其首要环节有着十分重要的研究意义。深度学习能够在大规模数据中学习到数据特征,能够应用至脉冲星辨识问题之中,然而深度模型体积庞大、难于部署,并且面对增量数据时的训练效率低。本文针对脉冲星辨识模型展开了相关的优化研究,在实现精准辨识的基础上,对辨识模型
学位