论文部分内容阅读
近年来,越来越多的高速宽带通信系统被应用于实际中,然而,由于低速率(LBR)和甚低速率(VLBR)语音通信是提供安全和保密语音通信的有效工具,故仍然比较重要,一直备受关注。另外,LBR和VLBR不需要占用太多的信道带宽,因此可以在很多恶劣的环境中应用。基于这些,本文重点研究和实现一种速率为600bps的语音编码算法。混合激励线性预测编码(MELP)将原始语音的编码比特率压缩至2.4Kbit/s,是LBR和VLBR语音通信领域中的一种非常典型和成功的语音编码方案。实际上,很多LBR和VLBR算法都是基于该编码方案实现和发展的。由于MELP算法较好的性能,本文也以其为基础,研究和实现一种600bps的语音编解码算法。本文设计的600bps算法中,语音帧长取为25ms,并将三帧组合成一个超级帧。在编码端,对每一帧信号进行分析并提取出四种参数;在解码端,利用这四种参数进行语音重构。这些参数中,线谱频率(LSF)用于描述声道特性,语音判决用于区分清音帧和浊音帧,基音周期用于给出语音的基本频率,而增益用来计算语音帧的能量。编码时,使用45比特对连续三帧语音所构成的超级帧的四种参数进行统一联合编码,达到降低编码比特率的目的。为了进一步降低编码比特率并提高语音质量,在本文设计的600bps语音编码算法基础上又引入了一种基于语音端点检测(VAD)和舒适噪声产生(CNG)模块的非连续传输(DTX)技术。该技术在编码端使用VAD算法将噪声和语音分开进行处理,由于对噪声帧采用的编码比特数远远少于语音帧,故可以达到降低编码比特率的目的。在解码端,若检测到噪声,则使用CNG算法产生对应的舒适噪声,以保证语音的连贯性。为了实际应用,又将设计的600bps语音编解码算法移植到TI TMS320C6416 DSP上,并对该编解码算法进行优化,使其在DSP-TMS320C6416开发板上能够很好的实时实现。采取的优化方法包括编译器选项优化、内联函数优化、C代码优化等,以此达到降低算法复杂度的目的。测试和评估结果表明,本文设计的600bps语音编解码算法能够获得较高可懂度的自然语音,其主观语音质量评估(PESQ)值为2.158。在高信噪比环境下,增加了非连续传输技术的语音编解码算法能在保证语音可懂度的同时降低编码比特率。在DSP平台上实现的600bps编解码算法的算法复杂度最终降至45兆周期/秒(MCPS)左右。