论文部分内容阅读
近二十年来,统计参数语音合成方法发展迅速,声学建模与声码器是其中两个关键技术。声码器用于从语音波形中提取基频、频谱等声学特征,以及基于声学模型预测的声学特征,以重构语音波形,传统声码器基于源-滤波器思想设计。但是现阶段基于源-滤波器模型的声码器仍然制约着统计参数合成语音质量的进一步提升。本文介绍了一种基于神经网络的语音合成声码器。