面向开放领域的知识图谱简单问答方法研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:rtreterter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于知识图谱的问答使用知识图谱的三元组事实(主语,关系,宾语)来回答自然语言问句,本文聚焦于面向开放领域知识图谱的简单问答,即该问句可以通过一个三元组事实得到答案。此类问答通常包含两个构件:主语识别和意图预测。经过主语识别和意图预测后,得到了该问句在知识图谱中对应的主语实体和关系,组成查询模式(主语,关系,?),查询知识图谱得到答案。现有的方法在主语识别和意图预测中都各自存在一些问题。在主语识别中,现有的方法忽略了知识图谱中实体信息的完整性,特别是忽略实体的类型属性,很容易导致实体混淆问题,即由于知识图谱中多个实体拥有相同的名称而使得问句中的主语不能够链接到知识图谱中正确的实体上。此外,在构建实体候选集的时候,现有的方法不能兼顾准确性与候选集的规模,降低了实体与问句匹配的正确率。在意图预测中,现有的使用深度学习的方法依赖于大规模的问答数据集,而由于成本的问题,现有的大规模的数据集很少被公开使用。另外,现有的方法在测试阶段时无法很好地回答在训练阶段未遇到的问句。针对主语识别和意图预测中存在的问题,本文进行了相关的研究。论文的主要研究内容包括:(1)在主语识别中,结合序列标注模型对主语实体进行扩展,创建了一个兼顾规模与准确率的候选实体集;针对实体混淆问题,提出了一种对实体的类型和名称属性进行多层次编码的神经网络模型,利用类型信息来区别拥有相同名称属性的不同实体。(2)在意图预测中,在测试阶段通过使用反馈实现持续学习不断提升准确率,摆脱了对大规模数据集的依赖;此外,设计了三种问句与关系的匹配方法,能够很好的处理在训练阶段没有遇到的新问句。(3)根据以上研究内容,开发了一个准确率较高的原型问答系统。实验结果表明:在主语识别中,本文提出的方法比当前先进方法的准确率提升了3.2%;在意图预测中,本方法能在规模较小的数据集下达到较高的准确率。这说明了本研究对解决上述问题的有效性。
其他文献
社交媒体的普及改变了人们分享和获取信息的方式。任何人在任何地点,只要拥有一台可以连接互联网的终端设备,就可以实时地跟踪热点新闻,分享自己观点看法。社交媒体在给人们带来便利的同时,也使得大量虚假的谣言能够在互联网上广泛的传播。社交媒体谣言不但会误导大众,而且会对社会和国家造成危害。目前,社交媒体谣言检测方法主要是基于帖子的内容和用户评论数据判断发布的帖子是否为谣言,本文分别针对这两个方面提出了不同的
学位
RDF(Resource Description Framework,资源描述框架)是用于描述互联网资源的通用框架。针对普通用户对RDF数据的搜索,由于用户不了解RDF数据概况以及用于查询的结构化语言又相对复杂,因此从RDF数据中搜索出目标资源对于普通用户而言是较为艰难的任务。面对用户不了解目标领域或者搜索任务相对困难的场景,探索式搜索成为普通用户搜索RDF数据的有效方法。随着RDF数据规模的日益
学位
数学是小学阶段一门重要的基础学科,新课程要求教师不仅要注重数学知识的传授,同时还应该关注学生的数学思维和能力发展,让学生掌握数学学习的有效方法和思想。这就要求教师打破传统教学模式,树立以学生为主体的教育理念,并给学生提供自主思考、合作探究的平台,教师则发挥引导作用来指导学生学习,成为学生数学学习的合作者和引导者。顺学而导理念刚好能够达成这一目标,因此,在小学数学教学中,教师应该基于顺学而导的理念开
期刊
资源描述框架(Resource Description Framework,简称RDF)及其模式RDF Schema(统称为RDF(S)),是万维网联盟(World Wide Web Consortium,W3C)推荐的用于语义Web处理数据的通用模型。RDF(S)的构建以及存储对语义Web的发展有着重大的影响。因此,将不同类型数据源中的数据自动构建成RDF(S)以及对RDF(S)进行有效管理成为
学位
随着语义Web技术的快速发展与进步,资源描述框架(RDF)作为W3C推荐的一种元数据模型和信息描述规范,广泛地应用于各种领域中。RDF模型是一种简单且易扩展的数据表示方式,能够准确,灵活地表达Web数据中的语义信息。各种实际应用中都存在着大量的时态信息。Web中的数据事实也是动态的,具有一定的时效性的。为了跟踪Web数据随时间的变化,将时态信息引入到RDF的框架中。因此,研究者们提出了时态RDF模
学位
随着基于位置服务的普及和空间定位技术的发展,许多应用通过获取移动终端的地理位置,向用户提供位置相关的服务和查询。空间索引在空间数据库中起着重要作用,其性能决定了数据访问和查询处理的效率。空间数据规模越来越大,如何设计一种高效、轻量的空间索引结构,提高数据库吞吐效率,并且减小索引文件的存储成本,一直是空间数据库领域的一个热点问题。本文设计并实现了一种空间对象学习索引——SLI(Spatial Lea
学位
随着物联网技术和智能医疗的发展,无线人体局域网的出现给目前医疗系统对病人的实时监测和响应处理提供一种新的可能。智能医疗的发展离不开数据的感知和采集,有了无线人体局域网的出现,数据的感知与采集将会变得十分便捷。虽然无线体域网有着很好的应用前景,但如何保证医疗用户隐私数据的安全性、无线体域网高效可靠的身份认证和安全管理也成为目前亟待解决的问题。本文深入研究了体域网智能医疗系统的安全框架及身份认证技术,
学位
知识图谱的研究包括构建与应用,而知识表示与推理不仅是实体对齐、三元组分类等构建技术的基础,而且是智能检索、知识问答、推荐系统等应用技术的关键,因此知识图谱的表示与推理是贯穿知识图谱构建与应用的关键基础研究。知识表示与推理研究的主要目的是提升推理能力与计算效率。但目前的方法大多仅关注推理能力,增加模型参数以提升模型性能,却降低了推理效率。基于属性、规则等额外信息增强知识表示学习和推理模型,不仅能提升
学位
语义Web是基于图和“链接”的组织方式,但是所链接的不再是网页而是客观世界中的实体,实体之间的链接也被增加了语义描述。RDF是语义Web中用于组织语义化数据的数据模型,RDF Schema通过定义RDF使用的词汇为其赋予语义。知识图谱作为语义Web发展的产物成为了研究的热点,知识图谱中将三元组称作为知识。RDF通过聚合大量的知识实现快速响应和推理,已经被广泛地应用到智能领域作为数据组织的方式。We
学位
无人机(Unmanned Aerial Vehicle,UAV)蜂群是近年来国际上的技术研究热点,它能够克服基于单UAV的所存在能力受限、生存率低和完成任务概率低等缺陷,协同多机以完成重要任务。设计实现UAV蜂群在理论上、实践上都是极具技术挑战的问题。本学位论文的研究目标是:深入研究UAV蜂群的某些关键技术,探讨设计实现UAV蜂群原型系统的方法。为此,本学位论文研究解决如下关键技术。首先,为使多架
学位