基于深度学习的智能问答系统的研究与实现

来源 :沈阳师范大学 | 被引量 : 9次 | 上传用户:moyan905254131
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网作为一个巨大信息资源库,人们已经习惯于通过搜索引擎(如Baidu、Google、Sohu、Yahoo等)的方式获取信息。但是用户在使用这种方法检索时发现诸多问题。首先,用户在通过普通搜索引擎检索信息时,它返回给用户的是很多相关的网页,导致用户接收到的信息多而不准确,需要花费额外的时间进行再次筛选;其次,目前大多数搜索引擎只允许按关键字的方式进行匹配检索,这种语言而非语义层面的信息并不能完全准确表达用户的意图,返回的答案也不能使用户满意。随着互联网技术的急速发展,人们已经不局限于简单的从互联网上获取信息再进行人工筛选的方式,而更倾向于使用高新技术快速、准确检索信息。因此,提出智能问答系统(Intelligent Question Answering System)来解决以上问题。智能问答系统致力于解决能够接收并处理自然语言形式的问句,并可以返回简洁准确的答案信息。目前,智能问答系统已经成为自然语言处理(Natural Language Processing,NLP)领域内众多专家与学者研究的一个热门方向。深度学习技术已经成为目前人工智能领域中应用前景最为广阔的技术,它是一种通过模拟人脑对数据进行分析与学习的神经网络(Neural NetWork),其主要模型是各种深度神经网络(Deep Neural Network)。最近几年,深度学习技术在自然语言处理等诸多领域都取得了很大成就,也为智能问答系统的研究带来很多突破。本文的研究目的是运用深度学习技术构建基于深度学习的问答模型,并将其应用到智能问答系统中。本文的主要工作如下:(1)基于词向量与长短期记忆(LongShortTerm Memory,LSTM)神经网络构建了问题分析模型。首先,对用户输入的问题进行预处理后,通过Word2Vec转化成向量,作为LSTM的模型的输入。然后经过LSTM进行词序语义学习,对问题的句法和语义特征进行表示。(2)针对LSTM无法很好地学习上下文信息的问题,提出基于双向长短时记忆神经网络与注意力机制的问答匹配算法。通过双向长短时记忆神经网络(Bidirectional LSTM)学习上下文语义信息,并引入注意力机制,改进了 LSTM问答算法在语义表征上的缺点。通过对实验数据的分析,验证了该算法的有效性,改善机器学习方法中的不足,提升问答系统的性能。(3)采用PyTorch深度学习框架对文中的问答模型进行实现,并采用Spring Boot微服务框架与MyBatis等技术设计并实现了智能问答系统,将文中的深度学习模型运用到该智能问答系统中,也验证了文中提出的问答模型的有效性。
其他文献
图像的超分辨率(SR, Super Resolution)研究是指从一幅或多幅低分辨率图像(LR, Low Resolution)序列中重构出一幅同场景的高分辨率图像(HR,HighResolution)的过程。近些年,SR
本文对H.264快速运动估计算法的优化进行了研究。文章针对UMHexagonS算法的不足,提出了一种改进的整像素快速运动估计增强EUMI-texagonS算法。增强算法通过增加提前终止阀值3,
“国民之魂,文化予之;国民之魄,文化铸之”。文化是民族的血脉,是人民的精神家园,而文化小康则更是全面小康的题中应有之义。放眼中外,大学历来是文化建设的首善之区与核心腹地。在全面建成小康社会的新征程中,大学应该主动突破那种将文化只是作为陪衬和装饰的视域局限,以前所未有的高度、空前重视的力度、历史纵深的广度,通过实现文化传承与创新和人才培养、科学研究及社会服务的深度融合,来加强和推进校园文化建设。  
期刊
[摘 要] 新时代我国社会主要矛盾反映到高等教育领域,就是发展结构的不均衡、不充分,一般地方高校(尤其是西部)发展滞后就是典型表现之一。这既不利于我国高教整体实力提升及高教强国建设,也不利于国家现代化建设及中国梦实现,当然也不利于教育公平、社会公平推进及和谐社会建设。国家应做好统筹规划,实施政策救济,开展“精准扶贫”“对口支援”等活动,促进地方高校内涵建设,持续发展。  [关键词] 高等教育;主要
G(o|¨)del语言是继Prolog语言之后出现的一种通用、高效、表达性较强的说明性逻辑程序设计语言,它摒弃了Prolog语言中的非逻辑成分,试图解决Prolog语言中存在的语义问题。在
量子信息与量子计算作为一门新兴的学科,是量子物理学与信息科学相结合的产物,越来越多的人正在对其进行研究。量子状态区分作为当今量子信息学研究的重要问题之一也引起了人们
随着多媒体技术和计算机网络技术的发展,数字产品的版权问题显得尤为重要,如何确保数字产品的安全已经成为国内外研究的热点。数字水印技术作为一种新的版权保护方法,从20世
机器翻译(MT)就是利用计算机将一种自然语言的文本或对话转换为另一种自然语言的文本或对话,同时保持语意的一致性。在给定源语言的情况下,机器翻译的过程就是寻找与源语言在
《中共中央关于构建社会主义和谐社会若干重大问题的决定》(以下简称《决定》),对构建社会主义和谐社会的重要性和紧迫性作了十分精辟 The “Decision of the CPC Central C
现代计算机系统都采用多任务多用户操作系统,系统中的每一个外部设备都需要驱动程序的支持。 随着外部设备种类越来越丰富,功能、接口更加多样化,与此相关的驱动程序支持也成