论文部分内容阅读
近年来,人工智能在诸多领域的尝试及成功,使其逐渐进入大众的视线。如何实现机器与人类的无障碍交流,是人工智能一直的研究内容。智能问答系统是实现这一愿景的非常有意义的一个切入点。现有的问答系统形式有多种,比如社区问答、知识问答及聊天机器人等。这些系统往往有一定的知识存储,在回答问题的时候首先根据自身的知识背景生成若干与问题相关的候选答案,然后再通过相关计算对候选答案打分,最后返回问题的最佳答案。本课题主要研究了问题候选答案的选择排序问题,即对给定问题的候选答案集中每个答案打分排序。其核心问题就是计算问题和候选答案之间的语义相似度。通过对相关工作调研分析,可以发现,在已有的研究工作中,前期工作主要是基于问题和候选答案的词汇、句法等特征完成的。随着深度学习在NLP中的应用,近期工作多采用深度学习模型来研究,该模型不需要借助其他语言工具或知识资源辅助。本文尝试构建了将深度学习与句子特征相结合的模型,来完成问题候选答案的选择排序问题,本文的主要贡献有以下几个方面:1.分别抽取了问题和候选答案的词汇特征、主题特征以及基于IBM Model-I的问题和候选答案间的对齐特征,并将这些特征与LSTM模型结合。2.构建了基于深度学习的答案选择排序算法框架,分别采用CNN和LSTM两种深度学习模型进行实验。实验结果表明,在答案选择排序的任务中,当不加任何外部特征时,本课题里LSTM模型表现整体高于CNN模型。3.在LSTM模型中加入问题和候选答案的相关特征,将词汇特征追加到LSTM模型的输入部分,将主题特征与LSTM模型的输出做特征组合,再将对齐特征作为在LSTM模型中引入attention机制的基础。实验结果表明,在LSTM模型中,无论加入主题特征还是引入attention机制,在问题候选答案的任务上都有较为显著的效果。4.将本文的模型在公开数据集上进行实验,结果表明当将主题特征与对齐特征和LSTM结合时,两个评价指标MAP和MRR最高分别可以达到78.9%和80.0%,均高于现有的工作结果。该实验结果也证明了本课题所提模型的合理性和有效性。