论文部分内容阅读
低码率语音编码是当今通信领域的关键技术。本文在特征波形内插(CWI)语音编码算法的基础上,分别提出一种1.8kbit/s基于音素分段的CW1编码算法和2.4kbit/s基于多带的CWI编码算法.论文的主要研究成果包括:
1.研究了在低码率语音编码中的语音分段算法。提出了一种基于小波变换累积能量的语音分段算法,提高了语音分段的精度。通过语音分段有效地区分有声段和无声段,只对有声段分配比特进行编码。利用语音分段后的每段语音中语音信号的相关性对参数压缩编码。
2.研究了线谱频率参数(LSF)的量化方法。利用LSF的帧间相关性,本文研究了一种基于暂时分解的LSF量化方法,将LSF的编码速率降低到695bit/s,大大降低了编码速率,并且获得了一个相对较低的平均谱失真。
3.研究了特征波形的量化方法。为了提高编码效率,将特征波形分解为慢渐变波形(SEW)和快渐变波形(REW),根据它们不同的感性特点分别量化。对于SEW,将其幅度谱分成三个子带进行量化;对于REW,采用正交多项式拟合的方法对其量化。
4.提出一种1.8kbit/s基于音素分段的CW1语音编码方案。该算法以音素分段为前端处理部分,用暂时分解算法量化LSF矢量,并以事件位置的间隔作为最终的语音分段点,以分段为单位对参数进行量化。主观听力测试表明,合成语音保持了较高的可懂度和一定的自然度,但是合成语音质量略低于2.4kbit/s的MELP算法。
5.提出一种2.4kbit/s基于多带的CWI语音编码方案。该算法引入MELP编码算法中多带的思想将语音谱分成多个频带,并在每个频带内分析声音强度,根据分析结果确定SEW和REW在相应频带的相位,使得合成语音的高频谐波得到较好的恢复,并且在内插瞬时特征波形时仅对特征波形部分对齐,大大降低了解码端的计算复杂度。主观听力测试表明,合成语音质量大大优于传统的2.4kbit/s的CWI编码算法,略优于2.4kbit/s的MELP编码算法。