论文部分内容阅读
近年来低速率语音编码得到了巨大的发展,目前,在4kb/s以下速率实现具有通信质量的编码器已成为当今语音编码领域的一大研究热点。波形内插(WI——Waveform Interpolation)作为一种极具潜力的语音编码方法受到了人们的关注。在传统的低比特率语音编码中,考虑到人耳对相位信息不敏感而经常忽略相位信息,这将导致语音粗糙、刺耳甚至音调发生改变。为了获得高质量的声码器,语音的相位信息是不能不考虑的。本文基于感觉加权相位谱分析合成(AbS- Analysis-by-Synthesis)矢量量化方法,给出了一种WI编码器中慢渐变波形(SEW- Slowly Evolving Waveform)的相位信息量化及合成端相位的三次多项式插值重建方法。主观A/B测试结果显示,当用4~6比特量化相位信息时,该方法合成的语音质量明显好于固定相位法和倒谱法。此外,本文在此基础上提出了一种相位预测式矢量量化方案,使得女声的语音合成质量有所改进。另外,本文给出了一种改进的WI编码器合成方案。在该方案中,当帧间的基音周期连续变化时,语音残差信号由幅度谱和相位轨迹直接合成,而当基音周期发生跳变时,则利用相位过渡过程合成语音残差信号。该方法大大降低了WI解码器的复杂度,同时保证了合成语音质量没有变化。