基于文本的实体关系抽取以及知识图谱的表示推理方法研究

来源 :北京化工大学 | 被引量 : 1次 | 上传用户:mobydick2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息通信技术特别是移动互联网的快速发展,人类逐渐进入数据大爆炸的时代,每天都会有海量的数据和知识产生。面对海量的数据,用户如何快速高效地获得有用的知识,成为了这个时代热门的课题和棘手的难题。把海量的无结构化文本数据以知识图谱的形式存储表征,成为现在一种主流的知识存储方式。在这一过程中从文本中抽取实体和关系以及已有知识图谱的推理和表示成为了知识图谱能够更好应用于具体领域的关键技术,因此本文的研究内容如下:1、针对现有实体关系联合抽取方法,底层语义编码过于简单,不能充分表征上下文语义的问题。本文通过在底层编码阶段加入多头注意力机制,同时把不同编码层训练出的语义表征拼接,从而在编码层实现更加丰富的语义表示,最终达到提升上层解码阶段的实体关系识别的效果。2、知识图谱中表示学习方法主要是以TransE方法为代表的翻译方法,它是把实体关系映射到低维连续的张量空间中,但是现有的翻译方法不能准确地表征复杂关系的三元组,比如一对多,多对一,多对多关系。针对基线方法局限性,提出了一种基于嵌入非对称的知识表示推理方法(AEM)。本文提出的AEM方法把头实体和尾实体映射到同一关系空间中的不同的子空间中,可以在极大程度上缓解复杂关系的表示问题,同时易训练、易使用。3、针对本文提出的基于嵌入非对称的知识表示推理方法(AEM)不能弹性的表征三元组的实体关系的问题,本文结合OrbitE方法,提出了基于流形的非对称嵌入知识表示推理方法(MAKR)。MAKR方法把通过对应关系空间映射的尾实体嵌入到关系超维流形球面上,而不是关系空间中的一个点上,可以在很大程度上缓解复杂关系中实体表征不严谨的问题。本文对MAKR方法在公开数据集上进行了训练和测试。实验结果和基线方法相比,获得了明显的提升,从而证明了本文提出的MAKR方法有效性。上述研究内容涵盖了知识图谱中的两大子任务:实体关系联合抽取和知识图谱表示和推理。本文基于两大子任务中现有方法存在的不足,提出的改进方法在获得了更好的提升效果,对知识图谱领域的技术进步具有一定的借鉴意义。
其他文献
现如今汽车电控技术迅猛的发展,给汽车维修方面带来了翻天覆地的变化,运用实证分析方式与比较分析法针对汽车电控技术在汽车领域实践中的运用进行研究,从而进一步提高现代汽
2017年,美国有4万人死于交通事故。过去几十年间致命的交通事故数量呈年度波动态势。2011年美国人出行次数受经济危机的影响有所降低时,致命交通事故数量达到低谷,为29867件;
当前,我国正由制造大国逐渐向制造强国进行转变,其核心在于大力发展智能制造,对此,本文将从机械设计技术的应用现状、智能机械制造的特点,以及智能机器制造的设计技术要点方
吕必松先生指出“汉语作为外语教学,其质量不但是教师素质决定的,而且也是由许多其他因素决定。在其他因素中,最重要的是总体设计和教材的科学性及适用性,如果没有这些条件,即使优秀的教师,也难以充分发挥作用”。这说明了教学设计对汉语作为第二语言教学的重要性。好的教学设计可以提高教师的教学质量和效率,也可以影响学生对知识的了解与掌握。近几年,柬埔寨汉语教学蓬勃发展,学习汉语的人数逐年增加,但是柬埔寨的汉语教
对采自福建龙岩地区15个猪场的2313份血清用间接血凝试验进行猪衣原体的抗体检测。结果表明,衣原体在龙岩地区的感染率27.71%,各猪场之间的感染率有所差异,抗体阳性率在16.67
探究式教学,主要是以学生自主学习为主、教师引导教育为辅,引导学生自己去认识和发现问题,激励学生积极动手、动脑,有效地提高学生的探索能力。本文主要针对大学物理教学现状
在大气污染物总量目标约束下,火电企业一方面通过安装脱硫脱硝设施以实现污染物减排目标,另一方面,通过执行排污权交易政策降低自身减排成本。然而,我国二氧化硫总量控制目标
排放权交易政策作为成本有效的政策工具,在全球温室气体或其它污染物减排中的使用势头渐进。但是,排放权交易政策几乎不会在一个政策真空中开始实施,总是与其它政策共同存在
随着经济的发展,高校扩招进程加快,我国在校研究生人数急剧增加。本文通过对1985-2010年各项数据的分析建立模型,进行OLS估计和序列相关检验,同时运用经济学原理,解释影响在校研究
精品资源共享课程是精品课程的转型和升级,精品基础课程建设是高校自身建设的重点,而网络平台建设是实现课程资源共享的主要途径之一。本文主要针对精品资源共享课程网络平台