面向知识图谱的表示学习算法研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:gmn10021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱是对实体间丰富关系的结构化信息编码,它旨在以三元组的形式将真实世界的事实组织成计算机可阅读的结构。其中三元组的具体表示形式为(h,r,t),h表示头实体,t表示尾实体,h和t之间的关系表示为r。可以看出,这种组织形式使知识图谱表现出严格的逻辑规则和分散的符号特征,在众多领域的应用中受到限制。为此人们提出了面向知识图谱的表示学习方法,将知识图谱中的每个元素(实体和关系)编码到一个连续的低维向量空间中,得到可计算的向量,比如TransE、TransH、TransR等基于翻译的表示学习模型。尽管这些模型获得了较好的知识表示,但是仍然存在一些问题。一方面,这些模型的侧重点大都在于学习独立的三元组所表示的语义特征,然而实体本身是一个综合属性的个体。事实上,针对不同的关系应该关注实体本身不同的属性表示。另一方面,知识图谱在构建时遵循了一定的人类认知思维方式,保留了实体间的语义层次结构。但是,传统的翻译模型在进行表示学习时忽略了实体间的语义范畴大小,所以不能很好地将知识图谱的语义层次表示出来。针对上述两个问题,本文引入了实体属性和语义层次信息,并提出以下两个解决方案:(1)提出基于PartOf关系的表示学习算法---TransP。通过分析知识图谱中的实体表现属性,发现PartOf关系下的三元组头部实体和尾部实体不属于同一实体类型,并且头实体是尾实体的组成部分,属性差异明显。因此,模型首先将每个实体都编码成球体,利用球体之间相对位置关系对PartOf关系类三元组进行建模。其次,根据其它翻译模型中的欧氏距离设计损失函数训练模型。最后,在训练过程中对边际参数进行了敏感性分析。(2)提出融合TransP及语义层次的表示学习算法---Trans_isA。在TransP的研究基础上,受到关系传递性启发,认为知识图谱中的语义层次关系在进行表示学习时应该保留传递性特征,以此来保证语义范畴的隶属特性。所以,模型首先按照二元关系的传递性判定条件对实体的语义关系进行建模。同时,为了将实体属性特征与实体间语义关系更好地结合起来,又融入了TransP模型的核心算法,有效地提高了Trans_isA模型的知识表示能力。在公开数据集WN18和WN18RR上,对上述两个模型进行了实验验证:首先,在链接预测实验中,模型的性能都有了较好的提升;其次,三元组分类实验中的各项测试指标均提高了10%左右,这展示了两个模型的表示学习能力。
其他文献
孔府档案是留存在山东曲阜关于孔氏家族的私家档案,它真实全面的记录了孔子及其后代子孙四百多年来的历史活动,具有珍贵的研究价值。然而由于该档案涉及范围广、内容复杂,对其内容的研究和开发难度大,进展缓慢。数字人文的诞生为孔府档案资源开发带来了新的契机。数字人文综合运用计算机技术对传统人文学科领域展开研究和创新,改变以往传统整理统计的研究模式,为文献及档案研究提供了更为方便简易的途径。因此如何运用数字人文
当今社会科技发展迅速,移动机器人在人类日常生活中扮演越来越重要角色,受到人们的广泛关注。移动机器人导航设计涉及环境感知、即时定位与建图(Simultaneous Localization and Mapping,SLAM)和路径规划等方面的研究。本文以机器人操作系统(Robot Operating System,ROS)作为开发平台,分别从SLAM与路径规划方面对移动机器人导航进行研究。在SLAM
2018年4月,教育部印发了《教育信息化2.0行动计划》,计划指出要在教育领域引入“平台+教育”的服务模式,同时智慧教育创新发展行动是该计划的重要举措之一,标志着教育领域已经着手开展“智慧化”建设。以此为风向标,高校对教育、科研进行信息化、数据化改革势在必行。高校是教学、科研的重要机构,高校图书馆作为高校的文化中心,应对师生教学以及科研工作提供有力的支持服务。在教育大数据视域下建设智慧服务模式是高
四旋翼目前在军用以及民用领域愈发普及,但由于其在飞行过程中容易受到外界干扰以及自身系统不确定性因素的原因,因此对四旋翼的扰动抑制研究具有重要意义。一方面四旋翼飞行器属于欠驱动系统,其六个自由度不能全部获得输入激励;另一方面,四旋翼飞行器还属于非线性、多变量、强耦合性和不确定性系统,因此对四旋翼飞行器控制器的研究具有重要意义。滑模控制是一种广泛应用在非线性领域的控制算法,通过设计滑模面,最终使误差收
带式输送机因其具有运输量大、运输距离长、持续性运输等优点,在港口煤炭运输行业成为了不可替代的运输工具。随着对煤炭需求量的逐渐增加,带式输送机将长时间高负荷生产工作,一旦设备发生故障,产生的经济损失将不可估量。目前基于带式输送机故障诊断主要是依靠人工巡检方式,该巡检方式因其工作量大、诊断效率低等缺点已不再适合当前生产现状。由于发现带式输送机在发生故障时产生的声音信号中包含了大量的故障信息,本文将通过
随着国内外老龄化程度的不断加深,老年人的健康问题得到广泛的关注。脑卒中作为发病率最高、危害较大的疾病,其后遗症所引起的上肢运动功能缺失的问题成为国内外研究的热点。目前,针对患者单侧上肢运动功能缺失的问题,一种方法是通过康复师辅助患者进行康复训练,但这种方法康复师的劳动强度过大;另一种方法是通过康复机器人进行辅助训练,但传统康复机器人只能带动患者进行单一、重复的运动训练,患者参与感低,人机交互能力差
随着人口老龄化的加剧,由于“脑卒中”等原因造成下肢运动障碍的患者逐渐增多,对患者本身造成不便的同时也增加了患者家庭和社会的负担。目前,使用下肢康复机器人对患者进行康复训练成为一种趋势,然而现有步态规划方法忽视了关节运动的协调性,所设计的步态轨迹会导致步行稳定性弱;一些不合理的控制器设计导致轨迹跟踪误差大,收敛速度慢,影响康复训练效果。为解决以上问题,提出一种基于莱维飞行粒子群算法的归一型步态规划法
随着科学技术的发展,人工智能开始逐渐深入我们生活的各个领域。为便于我国读者更好了解国外人工智能发展状况,相关翻译也成为一个重要手段。本实践报告的作者选取由Ronald Ashri所著的《人工智能工作场所》一书的三个章节作为翻译材料进行汉英翻译,并撰写了本翻译实践报告。书中详细介绍了人工智能的发展以及在工作场所中的应用,对于我国未来开发更加智能化的工作场所有一定的借鉴意义。本翻译实践报告首先对本翻译
运煤敞车的粘煤附着现象给煤矿的生产和运输带来了诸多不便,严重影响了煤炭企业、用煤企业的生产和效益,寻求一种安全高效、成本低廉、实时智能的方法来解决运煤敞车卸煤中的粘附问题成为煤炭运输行业亟待解决的关键问题。目前国内外对敞车卸煤存在的余煤残留问题主要的处理方式为人工清理或使用振动器进行清理,前者耗时耗力,清理效率很低;后者虽然能做到实时清理,但清理时噪音很大,且振动力量无法实时控制,容易对运煤车厢造
数字经济是指以数字化信息和知识为关键生产要素的广泛的经济活动。在新冠肺炎疫情肆虐的背景下,数字技术提高了现有产业的生产力,数字经济成为推动各国经济发展的重要动力。因此,需要为数字经济提供一套更为完善的治理体系来加快促进经济复苏和产业转型。译者选取了中国通信院于2019年12月发布的《数字经济治理白皮书(2019)》作为翻译任务的源文本,对其中三章进行翻译。所选部分全面概述了数字经济治理的现状和挑战