论文部分内容阅读
随着计算机技术的快速发展,语音合成技术也得到快速的发展并逐步渗透到社会生活的各个领域。但现阶段汉语语音合成中还存在一些问题,主要体现在输出语音的可懂度和自然度上。本文在对汉语韵律结构层级、声学特性以及目前最常用的几种汉语韵律短语预测机器学习方法调研的基础上,提出了一种基于支持向量机和隐马尔科夫混合模型(Support Vector Machine and Hidden Markov Model,SVM-HMM)的韵律短语边界预测方法;与此同时,为了进一步提高汉语韵律短语边界的准确度,本文还引入了一种基于纠错反馈驱动的学习方法来作为SVM-HMM模型的后处理方法,并实现了一个全自动的汉语韵律短语边界预测及标注系统。现阶段,在汉语韵律短语边界预测任务中广泛应用的统计模型为隐马尔科夫模型、最大熵马尔科夫模型以及条件随机场模型。其中最为成功的统计模型为条件随机场模型。本文所采用的SVM-HMM模型结合了支持向量机模型和隐马尔科夫模型各自的优点,同时克服了隐马尔科夫模型中的严格独立假设和难以引入任意特征等问题。和传统的机器学习方法相比,该模型仅用有限的训练数据进行训练就能够取得较好的预测效果。当前,SVM-HMM模型已经被应用在一些自然语言处理问题中,如:词性标注,汉语切分等。本文首次将支持向量机和隐马尔科夫的混合模型应用在汉语韵律短语边界预测任务中,并通过实验表明,在使用相同特征模板的情况下,SVM-HMM模型稍优于条件随机场,和最大熵马尔科夫相比更适合于汉语韵律短语的预测。
通过对SVM-HMM模型在汉语韵律短语预测实验结果的分析可知,单纯利用SVM-HMM模型的方法来预测韵律短语边界信息会带来一些很明显的错误。而这种错误的结果是由于系统在训练学习时的一些固定模式所导致的结果,因此为了进一步提高韵律短语边界预测的准确度,本文提出了一种基于纠错反馈驱动的学习方法(Transformation-baseed Error-Driven Learning Method,TBL)来对SVM-HMM标注模块所标注结果的错误部分进行了后处理,取得了很好的效果。