论文部分内容阅读
交互式问答受到了越来越多的关注。但交互式问答中存在着各种各样的语言现象,这些现象使得计算机难以充分理解用户的提问,指代现象就是其一。近年来,国内外许多学者对指代消解进行了大量细致的研究。但大部分研究都针对新闻文本中的指代进行,本文以已有的针对新闻文本的指代消解方案为基础,结合交互式问答自身的特点提出了适用交互式问答的指代消解方案。本文主要工作及贡献包括:首先,标注了交互式问答的指代消解语料。借鉴新闻指代消解的成熟标注方案,我们选取交互式问答领域广泛使用的TREC2004至TREC2007的评测语料进行了指代信息的标注,并就指代现象比较了交互式问答与传统新闻文本的异同。其次,提出了适于交互式问答的待消解项识别方法。分析传统的针对新闻文本的待消解项识别方法应用于交互式问答的不足,提出了针对交互式问答的待消解项识别新特征,改善了交互式问答中待消解项识别的性能。再次,针对交互式问答提出了基于话语结构的指代消解方法。分析传统针对新闻文本的指代消解方法在交互式问答中的不足,以交互问答场景中的话语结构理论为基础引入了描述话语结构的特征集。实验结果表明,新引入的话语特征能改善指代消解的性能,系统的F值提高了2.6%。最后,提出了基于中心理论和话语结构的指代消解方法。以中心理论为基础,利用话语结构获取问句中的优选中心,再结合话语结构中的话语转换信息确定句子之间的跳转关系。在此基础上引入了中心理论和话题结构相关的新特征集。实验结果显示这一方法能大大提高交互式问答中指代消解的性能,F值提高了3.2%。