论文部分内容阅读
目前,随着信息的增长速度加快,人们对于信息的选择显得越来越困难,过多的信息每天向我们袭来,因此能够及时而准确地为人们提供所需要的信息显得尤为重要且有意义。目前出现的交互式问答方式就很好的迎合了这种需求,它对用户自然语言的输入进行处理分析,返回给用户相关答案,这其中的处理分析步骤是最关键核心的一步。当前问答社区的大量问答资源可以为一些需求提供很大的支持,但仍有许多特定领域,问答资源则较为匮乏,比如金融、历史、旅游领域等。为此,本文针对以上问题,利用自然语言处理以及机器学习等相关技术,构建了一个导游对话系统。具体的研究内容主要包括以下几个方面:第一:为了解决目前旅游领域问答资源匮乏,从而给交互式问答系统带来不便的问题,本文提出了两种方法进行问题生成的研究。主要包括语义依存句法树的方法以及基于功能语块自动识别的方法。前者对问句句法结构分析后提取特定规则生成所需问句,后者对模型使用不同的特征组合进行实验,加入语义类特征进行改进,抽取特定的功能语块,生成疑问句。本文最终对生成问句的有效性进行分析,探讨不同方法的优缺点,达到提高问题生成性能的目的。第二:为了在交互式系统中对用户的问题与知识库中大量问题进行匹配,从而返回知识库的最佳答案,本文对向量空间模型与语义模型进行对比,使用词向量word2vec计算词语相似度来扩展语义模型,同时使用基于上下文调整权重的方法进行改进,最后对语料库中的句子使用主题模型进行建模,对新句子推理匹配,最终使得问句匹配达到了最好的效果。第三:本文将上述问题生成算法以及问句匹配推荐算法融合在交互式问答中,建立基于位置的导游对话系统。问题生成系统所生成的问题作为问答资源的扩充,对用户的语音或者文字的输入分析与知识库的匹配,返回适当的答案。为了更好的用户体验,引入位置定位,周边景点推荐等功能,最终为用户构建了一个多功能的,有良好交互的导游对话系统。