论文部分内容阅读
随着语音技术的不断进步,语音合成技术也有了非常显著的提高。语音合成的效果有了很大的改善,语音的可懂度和自然度也基本能够满足了人们的需求。然而用户对现有的语音合成系统也提出了更高的要求,尤其是对于个性化语音合成方面的需求。在这种背景下,个性化语音合成技术就具有了很高的理论研究和使用价值。本文首先分析了不同语音产生的机理并对影响语音个性化的特征参数进行了详细的实验研究;并搭建了基于HTK(HMM-Tool-Kit)平台的英文语音合成系统,该语音合成系统的设计主要包含了语音库数据的预处理、基频参数和梅尔倒谱参数的隐马尔可夫模型(HMM)训练以及参数语音合成三部分;最后在该系统合成出来的语音基础上进行个性化特征参数调整,完成了个性化语音的合成。本文的主要研究内容如下:(1)在分析语音合成原理以及当前常用语音合成算法的基础上,选取了基于HMM可训练语音合成算法来进行语音合成;设计了基于HTK的个性化语音合成系统框架,分析了个性化语音合成的难点以及本文研究的重点。(2)从语音产生的机理分析了语音个性化产生的原因,以及不同语音参数对语音个性化产生的影响,在此基础上选取了对语音个性化影响较大的四个特征参数(时长、基频、能量、共振峰)分别进行了实验分析,得出各个参数的调整和变化对语音个性化产生的具体影响。(3)在HTK语音合成系统设计当中,完成了语音合成的预处理工作,包括语料库的选取、语音库标注以及语音参数的提取;在模型训练过程中,解决了英文的上下文相关语法设计、问题集的设计以及基于决策树的模型聚类问题,并完成了合成系统的HMM训练;在语音合成阶段,完成了待合成语句的文本分析以及文本标注;最后在Unix环境下完成了基于HTK平台的英文语音合成。(4)使用Praat软件对合成语音以及目标语音的四个主要个性化特征参数进行提取与分析,对比二者之间的差别。在此基础上,对合成语音的个性化特征参数进行调整和修改,合成出具有个性化特征的语音,并对个性化语音进行测评。本文采用的个性化语音合成方法增强了合成语音的个性化特征。