论文部分内容阅读
本文介绍了一种基于多高斯建模和挑选的HMM语音合成方法。该方法的目的是通过多高斯建模和合成使得合成语音听上去音色更亮,更具多样性,音质更好。该方法在模型训练阶段使用高斯混和模型来表征用于合成的HMM 声学模型中每个状态的观测概率密度函数,并且在参数生成时采用了Viterbi 搜索算法来挑选用于合成的高斯分量序列。合成语音的测听实验表明,该方法与原来的单高斯基线系统相比,合成语音在音色、音质和韵律上都有所提升,合成语音也更具多样性。