论文部分内容阅读
随着科学技术的不断发展,语音合成技术近年来也取得了飞速的进步,大大推动了人机交互方式改变的进程。在语音合成领域应用比较多的语音合成方法主要有线性预测合成法和共振峰参数合成法。这些基于提取相关参数的合成方法在实现上相对简单,但是由于提取的语音参数并不能完全表示语音信号的特性,导致经由这些方法合成的语音信号的清晰度与自然度都不够理想。因此,基于基音同步叠加算法的语音合成技术应运而生。这种方法是在波形拼接合成算法的基础上,依据语音学规律,对合成语音的韵律进行调节(比如时长、基频等方面),从而获得更高的自然度。 在进行语音信号合成的过程中,基音周期的估计非常重要,它对语音信号合成的质量有着重大的影响。传统的基音周期估计算法主要有短时自相关函数法、短时平均幅度差函数法、倒谱法等,这些方法在对基音周期进行估计时都有着一定的缺陷。因此,本文在利用倒谱法提取基音周期的基础上,对其进行改进,将语音信号的线性预测与倒谱法相结合,使其能够更加有效地对基音周期进行估计。在韵律调节方面,本文通过对高兴、悲伤、愤怒、恐惧这四种语气下的语音信号进行分析,建立了不同语气下的语音信号与语音韵律之间的对应关系。最后,本文将改进后的基音周期估计方法运用到时域基音同步叠加算法当中,对合成语音信号进行韵律调节。 本文的仿真结果表明,在基音周期的估计方面,改进后的算法更加准确,可以减少倒谱法中的偏离点。在对合成的语音信号进行韵律调节方面,该算法可以取得不错的效果。