面向知识图谱补全的链接预测研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:yangmingmind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱(KG,Knowledge Graph)是人工智能研究和智能信息服务的核心技术,是真实世界信息的结构化表示。在一个知识图谱中,节点表示实体,边是连接两个实体的关系。由于知识图谱能够对结构化、复杂的数据进行建模,因此它被广泛应用于化学、生物、金融、医疗等诸多领域。尽管现有的大规模知识图谱已经含有丰富的知识,但是还是会出现不完整的情况,这个问题引发了链接预测(Link Prediction)的研究。链接预测是根据一定的预测机制,对知识图谱中的实体或者关系进行预测,从而完成知识图谱补全的任务。深度学习技术是目前处理链接预测的最好方法之一,其利用神经网络的学习能力来学习知识图谱上的实体、关系的表示,处理链接预测任务,从而完成知识图谱补全。尽管基于神经网络的模型在处理链接预测任务表现出显著的优势,但是仍然存在一些不足。知识图谱是由众多三元组构成的链接形成的一张具有复杂关系的关系图。然而,一方面,基于神经网络的知识图谱嵌入模型由于网络层的不断加深使得高层特征与底层特征之间位置模糊,即高层特征与底层特征无法对应,从而导致无法捕捉到组与组之间关系的问题;另一方面,在知识图谱嵌入模型的训练过程中,每个正样本三元组需要对应的负样本,当前多数负样本的生成方法使用了均匀采样(Uniform Sampling)的方式,容易造成训练过程中的梯度消失,因此,如何生成高质量的负样本也是一个亟待解决的问题。针对上述两个问题,本文主要研究内容如下;(1)提出了融合图注意力网络(GAT,Graph attention network)和胶囊神经网络(Caps Net,Capsule Network)的知识图谱嵌入模型,以编码器-解码器框架为基础,使用图注意力的特征嵌入方法捕获每个实体邻域中的实体和关系特征,引入胶囊神经网络来解码三元组,将节点嵌入特征定义为第一层胶囊,通过squash函数对第一层胶囊进行特征理解并定义为第二层胶囊,将生成的连续向量与权重向量做点积运算,再构建评分函数用于判断三元组的准确性,使得该模型能够充分捕获组与组之间的关系。在公开数据集WWN18RR和FB15K-237上,对该模型进行了链接预测实验验证,在公开数据集WWN18和FB15K上,进行了三元组分类实验验证,实验结果表明,本文提出的融合GAT和Caps Net模型能在处理链接预测和三元组分类任务中具有显著优势。(2)提出了基于Word Net的知识图谱负采样方法,并将该方法应用到(1)中提出的模型、Trans E和Trans H模型中。该方法使用Word Net同义词标号进行训练,首先利用Word Net上下位词词典,将知识库中具有上下位词层次性特征的三元组提取出来,进行分组,然后利用同一组内的相似实体进行相互替换,生成负三元组作为基本负样本库进行采样,根据不同的损失函数更新质量高的负三元组,最后,将正三元组与负三元组作为输入对模型进行训练。在公开数据集WWN18RR和FB15K-237上,对该方法进行了链接预测实验验证,在公开数据集WWN18和FB15K上,进行了三元组分类实验验证,实验结果表明,基于Word Net的负样本采样方法能够产生高质量负三元组,使知识图谱补全模型在各方面指标上都有显著提升。
其他文献
本翻译实践报告以切斯特曼翻译规范理论为指导,选取了《蓝背鱼》(Blueback)中前十章进行英汉翻译。该文本由蒂姆·温顿所著,讲述了一个关于友谊、承诺、对大自然的热爱以及对知识的追求的故事。儿童文学作品的翻译不仅能让更多的儿童体验世界儿童文学的魅力,而且能够丰富现有的儿童文学翻译研究。译者从句法、语义、语用三个层面分析翻译文本,句法层面上,采用语言单位转换、改变句式结构策略,使译文易于理解,生动有
学位
写作是目前国际英语教育领域关注的重点。在英语写作教学方面,读后续写为提高学生的外语写作水平提供了新的切入点,众多研究从不同视角证实了读后续写能够有效提高外语学习效率,促进理解与产出的结合。然而目前有关读后续写的实证研究较少,缺乏其对高中生英语语言产出准确性、复杂性和流利性的影响。此外,视听续写作为读后续写的一种变体,是否更有利于提高学生英语语言产出的三个维度尚不明确。鉴于此,本研究将读后续写和视听
学位
随着通信技术的不断普及,写作不仅成为公民生活的必要部分,写作能力更成为学习者的语言学习及学术成就方面重要的衡量标准。中国英语写作能力等级量表为适应生活与学术双方面的要求,将写作质量列为描述英语写作能力的第二项描述语(潘鸣威2017),这便突出了写作质量的重要性。《义务教育英语课程标准》(2021年版)适时提出听和读为理解、输入性技能,说和写为表达、输出性技能,两者在学习者的语言学习和日常沟通交际中
学位
支持性言语反馈是会话中一种常见的现象,是听话人为了鼓励、支持和帮助说话人,对说话人做出的积极言语回应行为。课堂教学中也存在着大量的师生对话,侧重师生间的交际互动,因此为支持和鼓励学生继续作答,教师会在学生回答问题期间进行支持性言语反馈。但前人研究多从静态的视角出发,鲜有学者从互动的视角研究这种语言现象。本研究以互动语言学和输出假说作为理论基础,对教师在英语课堂中使用的支持性言语反馈进行分析,在课堂
学位
<正> 环氧树脂是一类重要的合成树脂,世界年产量在20万吨左右。国内年产近万吨,主要由无锡、上海,岳阳三地生产。 环氧树脂的应用领域十分广泛,这不单是因为环氧树脂具有优异的物理、化学性能,而且还因为环氧树脂应用时的工艺适应性强。可以根据各种不同情况,不同的施工条件和特定的性能要求,来选择不同型号的树脂,不同类别的固化剂、增塑剂、填料、稀释剂、溶剂、促进剂和改性剂,组成各种
期刊
由于语法的正确应用在英语听说读写的学习中起到不可忽视的重要作用,语法教学在中国英语教学中始终占有重要地位,是英语教学系统中非常关键的环节,也是外语教学研究的热门话题之一。如何使用合理的语法教学方式来保证语法教学的有效性成了很多专家学者的研究重点,大多数研究重心放在通过研究学生学习结果来探究合理的语法教学方式,以至于研究合理语法教学方式的实效性时,仍需从学习过程的角度加以探究。本研究以加工层次理论为
学位
学生英语写作和英语写作教授一直是教育界的重点、难点问题。写作作为一项英语学习的必备输出技能,与阅读这种输入性技能相比,需要学生具备一定的综合语言运用能力。然而,目前学生排斥英语写作、英语写作成绩提高缓慢成为了初中英语写作教学的难题,尤其是初三学生,面临升学压力,时间紧张,仅靠教师批阅作文很难得到大量英语写作的实质性收获。因此,同伴反馈走入写作课堂,但由于反馈主体是学生,一直存有争议之声。动态评估理
学位
文风颇显成熟的孙频就像“80后”作家中的异类,有论者称她为“80后作家中的独行者”,其文字让人很难把她跟一个“80后”的女性作家联系起来,看过她作品的人都会猜测她应该是位中年作家。因为她的写作一改之前“80后”作家们或青春或叛逆的文风,显示出一种沉重和老成。作为起步较晚的“80后”作家,孙频也被一些研究者称为“纯文学作家”、“严肃文学创作者”,更有研究者将其作品归为“新伤痕文学”之列。她不爱青春的
学位
为了解项目式学习在中学物理阶段的研究现状及发展趋势,本文对中国知网(CNKI)数据库期刊收录刊发的论文进行年度发文、被引量、主题分布等加以统计、分析,进而发现基于项目式学习的中学物理教学研究仍处于起步阶段,距离大范围推广、实施项目式学习还有很长的路要走.
期刊
苏轼被翁方纲誉为“宋代诗人之冠冕”,是继唐代李杜之后又一位诗歌大家。苏诗接受始于宋代,后代诗家对苏诗的认识与接受有所起伏,至清乾嘉时期迎来又一个高峰期。本文在文献整理的基础上,总结归纳乾嘉诗话中关于苏轼诗歌、苏轼诗歌历史地位以及苏轼形象三方面的接受情况,并进一步探讨苏诗接受在乾嘉时期迎来鼎盛时刻的原因。具体内容如下:第一章主要围绕乾嘉诗话中对苏轼诗歌艺术技巧的讨论展开,分别对苏轼诗歌的表现手法、创
学位