论文部分内容阅读
首先,本文对言语行为基本理论和当前对话系统中的言语行为研究现状进行了概述,在参考了塞尔的言语行为分类标准和方法后,结合交通查询领域的实际特点,确定了七种交通查询领域的言语行为类型。
然后,本文使用多分类器综合的方法对言语行为进行分类。通过分类特征的比较实验,本文选取中文字符作为进行言语行为分类的特征。在单个不同的统计分类器的分类结果上进行二次分类。通过实验,具有最优结果的单个分类器是支持向量机,而具有最佳分类效果的方法是基于2-best的最大熵模型,说明多分类器综合的方法可以有效地进行交通查询领域内的言语行为分类。
最后,本文提出了一种统计和规则相结合的,引入言语行为理论的口语理解方法。该方法将口语理解分为两个阶段,第一阶段通过基于统计的分类方法进行言语行为的分类,第二阶段针对不同的言语行为类型,通过基于规则的容错句法分析技术进行深层的分析。本文选取了基于2-best的最大熵模型进行言语行为的分类和扩展的多层有限状态自动机进行快速部分句法分析,应用于上海市科委重点项目的交通查询系统中,有效解决了该领域内例句含有较多冗余、省略等口语现象的问题,提高了系统的容错性和健壮性。