论文部分内容阅读
随着计算机智能技术的飞速发展,语音合成已经越来越广泛地应用于社会生活的各个方面。其中合成自然度不够高的问题一直困扰着语音合成的发展。
本文在对汉语韵律结构预测研究的历史和现状做了较为完整调研的基础上,采用统计机器学习的方法,提出了一种基于最大熵马尔可夫模型的汉语韵律短语边界预测方法;与此同时,为减少制作韵律标注库时的手工工作量,本文引入一种应用于最大熵马尔可夫模型的主动学习方法,并实现了一个汉语韵律短语边界标注及预测的原型系统。
目前,对于汉语韵律短语边界的预测最成功的当属最大熵模型。本文采用的最大熵马尔可夫模型(Maximum Entropy Markov Model,MEMM)结合了最大熵模型和隐马尔可夫模型的优点。目前,MEMM已被应用于自然语言处理的一些方面,例如:词性标注,文本分割等。本文实验比较了最大熵模型和最大熵马尔可夫模型的预测效果,指出在使用相同特征模板的情况下,最大熵马尔可夫模型更适合于汉语韵律短语的预测。
在使用传统的机器学习方法进行分类时,为了得到好的训练结果就需要一个很大的训练集。而对训练集的人工标注是一件很费时费力的工作,尤其是针对语音合成所使用的汉语韵律语料库,迄今为止可利用的资源又很有限。本文基于主动学习的原理,引入一种应用于最大熵马尔可夫模型的主动学习方法,并将该方法应用于汉语韵律短语边界的预测,从而实现了一个原型系统。本系统通过人机协作的方式,在一个部分标注的训练集的基础上由计算机寻找出最需要被标注的数据,然后由人工来标注,如此迭代直到训练出的模型达到用户满意。多组实验证明应用该方法可以较好地解决韵律标注的主动学习问题,从而达到在大大降低人工工作量的基础上,利用部分已标注数据,仍然可以较好地完成汉语韵律短语边界预测的目的。