论文部分内容阅读
近年来,随着互联网的迅速发展和普及,各行各业都开始提供网络平台来完成与用户的交流与交易。为了能够及时地解答用户的疑惑,提高用户的使用体验,服务提供商通常都会提供人工客服平台来与客户进行交流,从而避免不必要的经济损失。然而,面对海量的在线使用者,人工客服会不可避免地遇到大量重复雷同的问题,消耗很多不必要的人力资源,在这种情况下,研发一个能够自动与用户完成问答交流的知识问答系统就显得尤为重要。在构筑知识问答系统的过程中,需要将用户输入问句映射到已有知识库问句中,而对问句分类能够缩小候选问句的数量,提升系统的响应效率,因此本文针对问句分类问题进行了深入的研究。本文基于对常见分类模型的研究结果,调研并实现了 MLP(Multilayer Perceptron,多层感知机)分类模型、CNN(Convolutional Neural Networks,卷积神经网络)分类模型、LSTM(Long Short-Term Memory,长短期记忆网络)分类模型三种常见的神经网络分类器。而后针对保险领域中的问句语料,提出了组合分类模型。利用线性回归的方法,将MLP、CNN、LSTM三种成熟的分类模型加以组合,构造了针对于本系统的组合分类模型,最后分别基于语料测试集和人工设计的问句测试集,设计实验对比了各个分类模型的分类效果,提高了问句分类模型的准确率。本文基于知识问答系统领域的研究现状,利用前文所述的研究成果,应用开源组合开发框架Spring,SpringMVC,MyBatis,实现了一个基于保险领域语料的知识问答系统。本文所设计实现的问答系统,在接收到用户的输入问句后,会对输入的问句依次进行问句理解、问句分类和问句匹配三步操作,从而在已经构筑好的知识库中寻找到相似的问句,将答案反馈给用户。如果问答系统无法在知识库中找到合适的答案,则通知工作人员进行人工回复,而后将人工问答的数据增加进数据库中,从而使得本系统具备不断完善,自我成长的能力。在问句理解模块,从多个维度研究归纳了理解问句隐含信息的方法,调研实现了各种问句理解的功能,包括:中文问句的分词处理,词向量模型的训练,问句疑问方向的识别,问句疑问类型的判断,问句句法结构的分析,问句主体的提取,语境上下文的补充等等。在问句匹配模块考虑到本文系统的独特环境,设计实现了基于问句理解结果的问句匹配模型,完成问句匹配的工作。