基于知识库的自动问答关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wxjct
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于知识库的自动问答系统为人们提供了一种直接、高效且准确的信息获取方式。近年来,随着信息抽取、数据挖掘等相关领域的不断发展,涌现了一批规模庞大、涵盖诸多领域内容的知识库,如Freebase、DBpedia等,为基于知识库的自动问答研究提供了良好的数据基础,并带来了新的挑战。目前主流的研究方法主要分为两类:基于语义分析的方法和基于信息检索的方法。基于语义分析的方法侧重于将自然语言形式的问句转换为某种逻辑表达式,如lambda表达式等,然后根据逻辑表达式查询知识库,获取答案;基于信息检索的方法则首先通过简单的方法从知识库中获取一系列候选答案,然后抽取相关特征对这些候选答案进行排序。随着人工神经网络和深度学习技术的不断发展,越来越多的研究者开始使用端到端的神经网络模型对知识库本身、问句与候选答案等内容进行表示学习,进而获取正确的答案。在中文领域,2016年的NLPCCICCPOL KBQA评测任务上发布了一个大规模的通用知识库,并包含相关的人工标注问答数据集。在此基础上,本文研究了知识库问答系统中涉及的两个关键技术:问句中的命名实体识别和问句到知识库内属性的映射。具体内容如下:1.基于LSTM语言模型的命名实体识别。为充分利用知识库提供的信息,本文基于排序方法进行实体识别。首先根据别名词典获取问句中包含的所有命名实体作为候选,然后使用LSTM语言模型结合简单的词汇特征对候选命名实体进行打分排序。2.基于卷积神经网络的属性映射。使用暹罗结构的多层卷积神经网络对问句和候选相关属性分别进行语义编码,将其转换为相同维度的语义向量,计算两者的语义相似度,选择与问句语义相近的知识库属性。使用注意力机制发现问句与属性间存在的单词对齐现象,结合简单的词汇特征,进一步提高属性映射准确率。3.基于LSTM模型的属性映射。提出了基于LSTM模型进行属性映射的方法,并将两种不同的注意力机制融合于LSTM模型中,进一步提高准确率。在得到属性映射的结果后,利用其对命名实体的结果进行重排序。最后,综合命名实体和属性映射的结果,对候选答案进行排序,选择问题的最终答案。
其他文献
在新课程指导下,教学过程需要重视教学的有效性,因此,教师在实践教学中需要构建高效的教学方式,不断提升学生掌握知识的能力,教师不仅需要明确教学的目标,在实践教学中通过良
本文以安徽中医药大学生物医学工程专业为例,就嵌入式系统课程本科教学过程中出现的问题进行了总结。凝练出“j结合两选择一构建”教学方式:(1)教材选择与专业建设相结合;(2)理论课
<正>《西南国防医药》是面向国内外公开发行的综合性医学学术和技术刊物,单月刊(刊号:CN51-1361/R,ISSN 1004-0188)。本刊为中国科技论文统计源期刊,被美国化学文摘(CA)、波
会计基础活动是对其核算以及管理活动的综合称谓。要想确保此项活动能够顺利开展,就需要设置足够的会计工作者,而且要有独特的机构组织。文章重点的分析介绍了此项活动相关的内
[目的]探讨我国人群身体质量指数(BMI)与肾移植术后新发糖尿病(PTDM)发病风险的关系。[方法]系统检索国内外公开发表的有关我国人群BMI与PTDM相关文献,并辅以文献追溯等方法,
高中数学学科知识的学习难度急剧上升,给学生带来了很大的困难,如何有效地教好数学课程也成为教师的一个难题。教改工作的不断深入,将多种教学方法引入了高中数学教学领域,微
当地时间3月4日,第90届奥斯卡颁奖典礼在美国好莱坞杜比剧院举行,获得最佳影片奖的是由吉尔莫·德尔·托罗执导,莎莉·霍金斯、迈克尔·珊农、道格·琼斯主演的《水形物语》。3
报纸
桃花坞年画起源于宋代,至今有数百年的历史。不仅积淀了丰富的文化内涵,而且具有极高的艺术价值。本文将桃花坞年画元素作为主要研究对象。首先,介绍桃花坞年画的工艺特色、
随着建筑业经济的发展,市场也呈现新的景象,施工企业为了能够中标,在保证微利润的条件下降低工程造价,中标后在过程中得到索赔,那么怎么能得到索赔,笔者就施工过程中四个阶段加以分
估算作为一种重要的数学思想,对小学生的发展起着至关重要的作用。提高估算教学不仅能够提升小学生的数学运算能力,还能够培养学生的数感。反观当前估算教学,其中还存在着许