论文部分内容阅读
互联网作为一个巨大信息资源库,人们已经习惯于通过搜索引擎(如Baidu、Google、Sohu、Yahoo等)的方式获取信息。但是用户在使用这种方法检索时发现诸多问题。首先,用户在通过普通搜索引擎检索信息时,它返回给用户的是很多相关的网页,导致用户接收到的信息多而不准确,需要花费额外的时间进行再次筛选;其次,目前大多数搜索引擎只允许按关键字的方式进行匹配检索,这种语言而非语义层面的信息并不能完全准确表达用户的意图,返回的答案也不能使用户满意。随着互联网技术的急速发展,人们已经不局限于简单的从互联网上获取信息再进行人工筛选的方式,而更倾向于使用高新技术快速、准确检索信息。因此,提出智能问答系统(Intelligent Question Answering System)来解决以上问题。智能问答系统致力于解决能够接收并处理自然语言形式的问句,并可以返回简洁准确的答案信息。目前,智能问答系统已经成为自然语言处理(Natural Language Processing,NLP)领域内众多专家与学者研究的一个热门方向。深度学习技术已经成为目前人工智能领域中应用前景最为广阔的技术,它是一种通过模拟人脑对数据进行分析与学习的神经网络(Neural NetWork),其主要模型是各种深度神经网络(Deep Neural Network)。最近几年,深度学习技术在自然语言处理等诸多领域都取得了很大成就,也为智能问答系统的研究带来很多突破。本文的研究目的是运用深度学习技术构建基于深度学习的问答模型,并将其应用到智能问答系统中。本文的主要工作如下:(1)基于词向量与长短期记忆(LongShortTerm Memory,LSTM)神经网络构建了问题分析模型。首先,对用户输入的问题进行预处理后,通过Word2Vec转化成向量,作为LSTM的模型的输入。然后经过LSTM进行词序语义学习,对问题的句法和语义特征进行表示。(2)针对LSTM无法很好地学习上下文信息的问题,提出基于双向长短时记忆神经网络与注意力机制的问答匹配算法。通过双向长短时记忆神经网络(Bidirectional LSTM)学习上下文语义信息,并引入注意力机制,改进了 LSTM问答算法在语义表征上的缺点。通过对实验数据的分析,验证了该算法的有效性,改善机器学习方法中的不足,提升问答系统的性能。(3)采用PyTorch深度学习框架对文中的问答模型进行实现,并采用Spring Boot微服务框架与MyBatis等技术设计并实现了智能问答系统,将文中的深度学习模型运用到该智能问答系统中,也验证了文中提出的问答模型的有效性。