论文部分内容阅读
语音合成是当今计算机智能应用领域的研究热点,目前它越来越广泛地应用于社会生活的各个方面,提高了人机交互性,发挥了很好的社会效益。随着当今社会计算机技术的快速发展,语音合成技术研究的不断深入,人们不但越来越需要了解自然话语的韵律结构,而且努力寻找通过文本信息预测韵律结构的方法,以便更加有效地提高合成语音的自然度和语音识别的准确率,同时加深自然语言理解的深度。语音合成,特别是汉语文语转换,首先需要在前端为输入的文本确定韵律结构来实现韵律合成。目前,文语转换的前端可利用的一般只有来自文本分析的信息,而缺乏韵律的信息。因此,值得探索的一个热点便是如何在文本信息的基础上来预测可能的韵律结构。现如今,这方面已经有各种各样的探索,也提出了一些较为有效的方法。不过,这方面还有潜力可挖,也有必要寻找更为全面的预测方法。因此本文主要研究的韵律结构预测,对于改善语音合成系统的自然度具有重要的应用意义。韵律结构预测的研究往往需要制作较大规模的标注语料库,于是就会产生大量的手工工作,特别是针对语音合成用的韵律语料库,到目前为止可利用的资源又非常的有限。为了减少标注训练语料库所需要的大量的时间以及人力,本文将基于互训练的半监督学习方法用于汉语韵律短语预测。由于条件随机场模型(Conditional Random Fields,CRFs)克服了隐马尔可夫模型中的严格独立假设和最大熵马尔可夫模型中的标注偏置问题,因此,本文将CRFs用于半监督学习中的初始分类器。本文实现了一个全自动的汉语韵律短语预测系统,该系统利用少量的已标注数据以及大量的未标注数据进行汉语韵律短语预测。多组实验证明,在同等规模训练集上,应用互训练的半监督方法可以有效提高模型训练得到的预测准确率,进而降低了人工的工作量,并且利用少量己标注数据完成对汉语韵律短语的预测。