面向知识库问答的深度神经网络语义匹配方法研究

来源 :中国工程物理研究院 | 被引量 : 1次 | 上传用户:tyftyf123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,可用信息量呈指数级增长,互联网已成为人们获取信息的重要途径。虽然当前的搜索引擎可以较好地帮助用户在互联网中搜索信息,但是也会返回大量与用户需求不相关的结果。基于知识库的自动问答系统指的是针对给出的自然语言形式问题,通过利用自然语言处理技术在结构化知识库中进行查询、推理、匹配得到相应答案。知识库问答系统不仅可以为用户提供支持自然语言的友好人机交互方式,还可以精准并高效地帮助用户获取到有效的信息。因而知识库问答是自然语言处理和信息检索领域重要的研究方向。传统基于符号的知识库问答方法往往难以解决文本的语义鸿沟问题,基于向量空间建模的方法试图用向量的形式解决该问题,但该方法仅涉及浅层的语义表示。此外,与英文相比,中文的语法结构和表述形式更为复杂和多变,所以中文知识库问答的研究面临着更大的挑战。针对以上情况,本文主要研究基于深度神经网络的文本语义学习与匹配,然后将其应用于知识库问答中,即将问答的过程视为问句与知识库语义表示的学习和匹配过程。主要研究内容如下:(1)针对文本语义的学习和匹配,提出一种带注意力机制的长短时记忆网络的文本语义匹配方法。该方法首先使用长短时记忆网络和注意力机制对文本进行深度语义表征和学习,然后通过三种不同的池化机制从不同的角度将文本语义矩阵聚合成语义向量,最后将文本对的语义向量锐化后传入分类器中得到语义匹配结果,该方法明显地提高了文本语义匹配的准确性。(2)针对问句的实体链指,设计实现一种基于知识库的二分类方法。为了使该任务简单化,首先通过知识库找到对应问句的候选实体,然后通过特征工程提取候选实体的特征,并构建二分类模型,最后根据模型的预测得分排序选出得分最高者,该方法简单高效地解决了知识库问答中的问句实体链指任务。(3)基于深度文本语义匹配方法和实体链指技术,本文将其应用于知识库问答。首先通过实体链指技术识别问句的实体,进而在知识库中找到相关候选答案,然后使用深度神经网络学习问句与候选答案信息的语义表示,并根据它们的语义匹配结果选出最佳答案。该方法可以较好地解决传统知识库问答方法中存在的语义鸿沟问题,从而提高问答的准确率。此外,本文采用模型融合方法进一步提升了知识库问答的准确率。
其他文献
<正> 议论,作为一种表达方式,它在记叙文中是常常出现的、作者在写人记事的同时,往往根据表达中心意思的需要,穿插一些精要的议论,这样可以揭示所记写的人或事的本质意义,以
七十年的发展历程谱写了中华民族迈向伟大复兴的历史篇章,不仅为我国全面建成小康社会、建成社会主义现代化强国打下了坚实基础,而且为绘制包容共生的世界文明愿景作出了中国
项目教学法提倡先学后教,强调学生的自主学习、积极参与,尝试从活动开始,调动学生学习的主动性、创造性、积极性,学生唱“主角”,教师唱“配角”,实现教师角色转换。这种教学法有利
本文首先梳理了母系神话的演变过程,运用考古学、美术学、文学、神话学等学科的研究成果还原上古女性神从史前的大母神系统中演变、分化、被父权社会压制的历程,并分析吴承恩所著《西游记》女妖与上古女性神之间的关系。随后,用女性主义、原型理论等方法具体分析吴承恩所著《西游记》中的女妖群体形象,分析女妖群体的特征、形成原因和从中透出的男权主义思想。除去导论和结论,正文分为三部分:第一部分母系神话的演变,分为原母
城市水系是构建海绵城市的四大系统之一,在城市防洪、排水及改善生态环境等方面发挥重要作用,而河道是城市水系建设的重要组成部分,也是构建整个生态系统的重要元素。城市河
羟基酪醇是橄榄苦苷的水解产物,也是中药丁香叶中的重要活性物质基础。研究发现,羟基酪醇在心脑血管疾病、抗炎、抗病毒及抗癌方面具有积极的治疗作用,受到国内外学者的广泛
本研究目的:2008年北京奥运中,中国队突破金牌数,利用中西结合治疗,降低受伤率和提高运动员身体素质,传统医学已运动医学重要的因素。1.观察讨优秀跆拳道选手受伤率和治疗情形
目的:运用多层螺旋CT(MSCT)扫描得出的原始数据,进行多平面重组(MPR)后处理。在重组矢状面图像上,对前庭导水管中段宽度值进行测量,并建立95%的医学参考值范围,对其规律进行
1近年我国主要谷物生产和消费量2003年谷物产量:稻谷1.6亿t;小麦0.865亿t,玉米1.158亿t;薯类0.3513亿t.2004年谷物产量4.65亿t:其中稻谷1.81亿t;小麦0.91亿t;玉米1.317亿t.
享誉世界的德国著名儿童小说作家奥利佛·哈森坎普,其代表作《恐怖石堡》系列小说可谓家喻户晓,该套书自1959年出版第一卷后,至今已经拥有数百万热心读者。最近,该套书的中文简体
报纸