论文部分内容阅读
随着信息化程度的提高,人们对语音通信的需求不断增加,低速率语音编码技术在通信领域发挥着越来越重要的作用。最基本的低速率语音编码算法都采用线性预测编码(LPC)技术,LPC-10声码器和MELP声码器都是成功应用LPC技术的典范。LPC-10声码器从1986年开始作为美国第三代保密电话语音通信标准;1997年MELP声码器以其高质量的合成语音代替LPC-10声码器,成为新的美国联邦标准。在衡量语音编码算法性能的指标中,最重要的是合成语音质量和算法的运算复杂度。但是这两个指标通常是相互矛盾的,如何在两者之间得到合理的折中,成为语音编码算法需要考虑的关键问题。另外,LPC-10与MELP语音编码算法之间并不兼容,导致采用这两种算法的通信系统间不能直接进行通信。这就必然要求一种码流转换方案完成两种算法体制的转换,实现它们之间的相互通信。论文从语音编码算法的基础出发,研究语音编码能够实现较低速率编码的理论依据。在此基础上深入研究MELP语音编码算法的实现原理,并在PC机上利用C语言在Microsoft Visual Studio 2003环境下仿真了MELP算法的编解码过程。利用ITU推荐的P.862算法(PESQ)评估了其语音质量。针对MELP语音编码算法计算复杂度高的问题,论文提出了利用快速搜索的树型矢量量化代替多级矢量量化的方法,降低编码算法的计算复杂度;同时通过优化过渡帧和优化提取基音周期等措施保证合成语音质量,使改进后的算法在合成语音质量和计算复杂度上得到折中。利用TI公司的开发软件CCS对改进后的代码进行优化后在TMS320C6418 DSP平台上实现改进后的声码器的算法功能。通过非正式主观测试及PESQ测试结果表明,改进的MELP声码器能够在2.4k/s的速率下获得较为理想的合成语音质量,具有较好的可懂度和清晰度。为了减少Tandem方式编码转换造成的语音失真,论文提出了参数直接转换方案实现MELP与LPC-10语音编码之间的编码转换。详细分析了LPC系数、基音周期、清浊音判决和增益等编码参数在不经过二次编译码的情况下,直接利用编码参数实现它们之间的码流转换过程。对转换以后的合成语音质量采用PESQ MOS技术给出了客观评价。结果表明,参数直接转换方案与Tandem方式转换结果相比,不但较好地保证了合成语音质量,而且有效地降低了程序的运算量。