低码率特征波形内插语音编码算法的关键技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:wwxxzz123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
低码率语音编码是当今通信领域的关键技术。本文在特征波形内插(CWI)语音编码算法的基础上,分别提出一种1.8kbit/s基于音素分段的CW1编码算法和2.4kbit/s基于多带的CWI编码算法.论文的主要研究成果包括: 1.研究了在低码率语音编码中的语音分段算法。提出了一种基于小波变换累积能量的语音分段算法,提高了语音分段的精度。通过语音分段有效地区分有声段和无声段,只对有声段分配比特进行编码。利用语音分段后的每段语音中语音信号的相关性对参数压缩编码。 2.研究了线谱频率参数(LSF)的量化方法。利用LSF的帧间相关性,本文研究了一种基于暂时分解的LSF量化方法,将LSF的编码速率降低到695bit/s,大大降低了编码速率,并且获得了一个相对较低的平均谱失真。 3.研究了特征波形的量化方法。为了提高编码效率,将特征波形分解为慢渐变波形(SEW)和快渐变波形(REW),根据它们不同的感性特点分别量化。对于SEW,将其幅度谱分成三个子带进行量化;对于REW,采用正交多项式拟合的方法对其量化。 4.提出一种1.8kbit/s基于音素分段的CW1语音编码方案。该算法以音素分段为前端处理部分,用暂时分解算法量化LSF矢量,并以事件位置的间隔作为最终的语音分段点,以分段为单位对参数进行量化。主观听力测试表明,合成语音保持了较高的可懂度和一定的自然度,但是合成语音质量略低于2.4kbit/s的MELP算法。 5.提出一种2.4kbit/s基于多带的CWI语音编码方案。该算法引入MELP编码算法中多带的思想将语音谱分成多个频带,并在每个频带内分析声音强度,根据分析结果确定SEW和REW在相应频带的相位,使得合成语音的高频谐波得到较好的恢复,并且在内插瞬时特征波形时仅对特征波形部分对齐,大大降低了解码端的计算复杂度。主观听力测试表明,合成语音质量大大优于传统的2.4kbit/s的CWI编码算法,略优于2.4kbit/s的MELP编码算法。
其他文献
无线网格网络(Wireless Mesh Network),简称WMN,是一种新型的无线通信网络,它可以看成是一种特殊WLAN(无线局域网),除移动性较低外,无线网格网络本质上是一种Ad hoc网络。网
MPC8280是专为电信和网络市场而设计的先进集成通信微处理器,它具有高速的嵌入式PowerPC内核和很高的网络与通信外围设备集成度,使用它可以设计出综合性能比高的通信与组网设
分布式天线系统(DAS)将若干个从属于基站侧的天线分散开来放在小区的不同位置,减小了天线离移动台的平均距离,使频谱利用率较传统的将多个天线放在小区中心的集中式天线系统(CAS)有