论文部分内容阅读
在过去的十几年里,由于多种因素的推动,口语对话系统经历了蓬勃发展。但其中也存在着一些不尽人意之处,作为中心控制模块的对话管理就是众所周知的薄弱环节之一。经过深入分析发现,导致对话管理薄弱的主要原因来自作为对话管理理论基础的对话模型。因此本文的工作主要围绕着对话模型的概念框架及其经验计算展开研究。
首先,通过从现有的关于对话的话语和语用研究中汲取营养,基于将对话和话语看成既是产物又是过程的观点,一方面区分面向任务的对话中的五个阶次的单位,另一方面区分三个层次的动态过程,从而建立了面向对话管理的对话模型。这为进一步的计算分析提供了概念框架。另外,由于本文所要进行计算分析的是自然口语对话,在处理“现实世界问题”上具有一定潜力的经验方法成为了本文的选择。这为进一步的计算分析提供了方法基础。
接下来,本文工作集中在如何采用所提出的概念框架对自然口语对话进行经验分析,包括人工标注和自动分析。具体进行研究的包括句子类型、语句主题和语力以及交互模式。
1)句子类型:为了适应自然口语对话的需要,扩展了传统的句子类型,并建立了三个算法(启发式,朴素Bayes分类器/NBC和隐Markov模型/HMM)来实现自动分析。
2)语句主题:本文将语句主题定义为对话中说话者所关注的显著语义实体。通过分析语料发现,语句主题具有局部连续性,并且跟扩展句子类型也有密切的关系。根据这些建立了语句主题的自动分析算法,来实现基于浅层语义分析的语句主题识别。
3)语力:首先基于已有语力分类工作(包括来自语言哲学的、话语分析的、语用的以及话语经验研究的工作),建立了新的分类体系。然后采用它对语料进行了标注分析,并使用NBC和HMM实现自动分类。
4)语句组:通过综合话语分析中的语换和系统功能语法关于言语功能的工作,提出一个原则性的语句组分类,以描述信息类对话中的交互模式。然后考察扩展句子类型和语句主题跟语句组的关系,并根据这些关系建立相应算法,对语料进行自动分析。