基于知识图谱的简单问答算法的研究与实现

来源 :吉林大学 | 被引量 : 0次 | 上传用户:pangjunli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱是从大量事实中提取出来的。它大致分为两类,一类是从维基百科等知识库中提取的实体及其之间的联系;另一类是从大量页面中抽取的具有实体关系的三元组,这样的三元组内容更加丰富,也使得噪音较多。随着这些知识图谱的出现,人们开始利用有效的方法来获取知识图谱中的大量有价值的内容。为此,人们提出了许多查询语言。但是,这些语言中的语法不易被人们理解,因此,提出了许多基于知识图谱的问题回答算法。在人工智能领域里,基于知识图谱的问答将知识图谱作为回答人类问题的关键要素。这是一种良好的解决问题的办法,对人工智能发展起到了推进作用。基于知识图谱的问答任务有两条主要的研究路线:第一种是语义解析方法,就是将问题映射到其逻辑形式上,然后转换为结构化查询;另一种是基于神经网络的方法,这类方法同样也有两个分支,即为管道框架和端到端框架。本文主要研究的是处理单关系问题的管道框架。与端到端框架不同,管道框架的每个模块之间紧密连接,中间应用了许多深度学习框架。该框架需要各个模块均得到最优的结果,才能保证最终结果优于其他算法。管道框架的整体结构如下:(1)用于识别问题中实体提及的实体检测模块;(2)用于在知识图谱中生成问题指向的实体候选的实体链接模块;(3)用于测量问题与关系候选之间语义相似性的关系检测模块。在实体检测模块中,给定一个问题,实体检测的目标是识别提及范围中的连续标记,该标记涉及的是问题中的主题实体。本文使用的是最常用的BiGRU-CRF模型来进行标记实体。并用特殊符号进行实体替换,将问题转换为问题模式。在实体链接模块中,本文在传统的字符串匹配算法的基础上,添加了多标签分类模型,得到本文中新算法——基于问题模式分类的实体链接算法。在关系检测模块中,本文提出了一种检测模型——基于注意力的问题模式关系匹配模型进行关系检测,该模型涉及两个级别的关系编码,分别是单词级别和关系级别。本文在SimpleQuestions数据集上进行的验证实验。实验结果(80.80%)表明,与以往的方法相比,本文实现的管道框架是可行有效的。对于实体检测模块,本文使用了四种模型,结果(97.41%)表明BiGRU-CRF模型能够获得较高的准确率。对于实体链接模块,本文提出基于问题模式分类的实体链接算法同样是有效的,很大程度上优于基于传统字符串匹配的方法,并且具备普遍性。对实体检测模块,本文采用的基于注意力的问题模式关系匹配模型准确率同样较高。
其他文献
随着手机等移动智能设备的普及,运行在这些设备上的App软件也得到了快速发展。随之产生的App应用商店,在为用户下载App提供便利的同时,也带来激烈的产品竞争。一款App想要在应用商店中立足,了解同类产品所具有的功能以及功能的细节特点是十分重要的。然而,应用市场中包含大量的App产品,在产品经理设计一款App功能时,很难全面了解所有同类产品。针对这一问题,本文提出了基于深层次特征的竞争分析(DFCA
由于能源危机和环境问题,新能源的开发迫在眉睫。太阳能作为取之不尽、用之不竭的新能源,具有巨大的发展潜力。因此,大力发展太阳能电池势在必行。钙钛矿电池作为第三代太阳
圆极化天线由于在抗干扰性、可以同时作为收发天线等方面的优点而被广泛应用。通信系统频段作为一种资源,面临着日渐紧缺的困境,如何在有限的频谱资源下尽可能提升通信容量是专家学者正在探究的方向,本课题致力于研究在多个频段产生圆极化辐射特性,保证各自频段独立工作且具有较小的高低频中心频率比,具有重要的研究意义和工程价值。本课题旨在探讨多频左右旋的圆极化天线以及降低频率比的方法。本文的研究内容包括:第一,论文
基于中国制造2025与工业4.0的背景下,机器人在航空航天、海洋装备制造等领域中得到广泛的应用。目前,现有的通用型装配机器人大多以串联关节型工业机器人为本体,该类型机器人仅适用于轻小型工件的对接和装配,由于外界环境对机器人末端施加力和力矩,致使其在对接与装配过程中运动不平稳、精度不高。本文针对此问题,结合吉林省科技发展计划项目“具有自主定位导航的大工件柔顺装配对接机器人”,搭建以并联六自由度机器人
党的十八大以来,我国经济社会发展、尤其是地方农村发展在各方面各领域都取得了优异的成绩。十九大报告中指出“实施乡村振兴战略,农业农村农民问题是关系国计民生的根本性问题,必须始终把解决好“三农”问题作为全党工作重中之重。”[1]实施乡村振兴战略。借着乡村振兴的东风,B市通过组建具有投融资性质的皎月公司,结合地方优势资源和政策红利,发挥资源资产的金融杠杆撬动作用,试图破解制约区域经济发展的资金瓶颈和产业
近年来,限域离子液体在催化反应和气体捕捉中的应用备受关注,其优异的特性展现出良好的应用前景。但是关于限域离子液体的模拟工作很少,并且大都集中在分子动力学性质方面,很
在最近二十年间,世界进入互联网时代,人们的线上社交活动与线下生活文化完全交织在一起,人们接受信息的方式也从被动转换为主动,每个人都成为了信息的挖掘者与传播者,各种社交媒体应运而生。微博作为国内主流网络社交媒体聚积了数亿用户,在上面用户可以对网络上新发布的政策、工业产品、时事热点等发表自己的观点立场,如何在特定目标话题下有效的对用户立场进行判断成为网络舆情分析的重要课题。微博文本具有网络化、噪音多样
目的:卫生系统反应性是指卫生系统对个体改善非健康方面普遍合理期望的认知和适当反应。本研究通过了解广州市属三级医院卫生系统反应性的现状,分析当前广州市居民对市属三级医院卫生系统反应性评价中存在的问题并探讨其影响因素,为进一步完善和提高医疗机构特别是三级公立医院的卫生系统反应性提供科学依据。对象:本研究采用判断抽样的方法,首先从广州市属15家三级医院中抽取5家医院(3家综合医院、1家专科医院、1家中医
近年来,知识图谱的构建和应用迅速增长。知识图谱是指其节点是现实世界中的实体并且边是实体之间的关系的网络,表示为三元组形式(头实体,关系,尾实体)。这样由三元组形式的大量事实组成的网络建立了人类知识的结构系统。人们已经创建了大量的知识图谱,例如YAGO,NELL和Freebase。并且人们成功将其应用于很多领域,从语义解析和命名实体消歧到信息提取和问答。虽然这种结构能有效地表示结构化数据,但它却很难
随着人类社会的发展,越来越多的智能产品进入了我们的生活。而SIP协议由于其灵活开放的特点,被许多的智能设备采用为信令协议。在流媒体服务器方面,主要有HTTP渐进下载式服务器和基于RTSP的实时流媒体传输服务器,基于SIP协议的智能设备系统通常采用后者。但由于SIP协议只规定会话开启的方式,使得对于不同的智能设备系统的音视频编解码流程和传输方式可能存在很大的不同,极不利于终端的解码模块开发与服务器的