论文部分内容阅读
本论文基于深度学习的方法对问答领域的两个重要的问题进行了相关的探索与研究。第一个研究问题是问题意图层次分类,对于类别为层次结构的问题意图,设计模型充分利用类别间的层次关系,准确地对问题的意图进行分类;第二个研究问题是段落层面的问答匹配,在机器阅读理解任务中,判断给定的段落是否能够回答对应的问题。 在很多问答场景中,问题意图的类别往往被组织成层次结构,一般的文本分类算法不能充分利用类别间的层次关联。本文将文本层次分类任务视作序列到序列学习,以序列到序列学习的形式对层次类别进行预测,让模型去自动学习类别间的层次关联。实验结果显示,无论是在问题意图层次分类的数据上,还是在其他类型的文本层次分类数据集上,本文所提出的模型的分类性能都要明显优于现有的一些文本分类模型。 对于段落层面的问答匹配,首先,问答匹配不同于如转述识别、相关性匹配等文本匹配任务,问题与答案间的语义信息不对等;此外,在段落层面的问答匹配中,段落中包含更多的冗余信息,这进一步加大了问题的挑战。本论文受当前机器阅读理解模型的启发,设计了段落层面的问答匹配模型,该模型在编码模块中能够充分捕捉段落与问题间较深层的语义交互信息,在大规模的问题与段落对数据上,其结果要显著地优于当前经典的基于深度学习的文本匹配模型。