论文部分内容阅读
在语音合成的研究中,基于HMM的统计参数语音合成近些年在汉语等成熟语种中的广泛应用的同时,也逐渐开始应用在藏语等少数民族语言在内的语言学的研究中,文本分析对合成语音的自然度和清晰度有着很大的影响,然而现阶段藏语语音合成过程往往忽略前端文本分析的研究,因而藏语文本分析的研究还处于起步阶段,该方法的训练阶段和合成阶段的研究都需要经过必要的文本分析阶段,在训练阶段我们主要通过文本分析获取后端合成阶段所需要的单音素标注和上下文相关标注等标注信息,在合成阶段我们也需要通过文本分析获取藏语文本的上下文相关标注信息,其中单音素标注信息指的主要是输入的藏语文本的声韵母信息,上下文相关标注信息指的是声韵母层、音节层、词层、短语层和句子层等五层的标注信息及其位置信息。本文的研究目的在于通过藏语文本分析获取文本的单音素和上下文标注信息,实现自动标注对手工标注的替换。 论文的主要工作和创新如下: 1.设计了藏语拉萨话语音合成语料库。藏语属汉藏语系,也是一种常用的少数民族语言,本文在研究过程中主要是针对具有典型代表性的藏语拉萨话,通过大量藏语语料的筛选,构建了一个具有典型代表性的800句藏语小语料库和2000句的大语料库,并且邀请了我校民族学院的两名藏族男同学和两名藏族女同学在专业的录音棚里进行了声音语料的录制,以确保后端合成高质量的语音。 2.通过藏语语料的筛选,设计了一个包含藏语声韵母、音节、词、短语在内的藏语词典库,以便后端正向最大匹配算法的使用。鉴于本文研究的目的是获取藏语文本的单音素标注信息和上下文相关标注信息,因为藏语音节间和藏语句子间都有一个特殊的藏文符号,因而本文便利用此符号设计算法获取文本音节信息和句子信息,通过藏语基字丁的分解获得其声韵母信息,本文中运用基于词典库下的最大匹配算法获取文本的词和短语信息等,在上下文相关标注的获取中,设计了五层标注格式,并设计算法以获得输入藏语文本的上下文标注信息。 3在HTS中对本文文本分析方法所获得的标注信息进行了统计参数语音合成。最后,为了验证合成语音的质量,我们对合成语音进行了MOS和DMOS主观评测,在800句语料库下,其合成语音平均MOS得分和DMOS得分分别为3.0分和3.3分,这表明本文文本分析方法在后端合成语音自然度和相似度方面是可行的。