MELP声码器优化设计及与LPC-10编码的转换

来源 :重庆大学 | 被引量 : 0次 | 上传用户:netboy1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化程度的提高,人们对语音通信的需求不断增加,低速率语音编码技术在通信领域发挥着越来越重要的作用。最基本的低速率语音编码算法都采用线性预测编码(LPC)技术,LPC-10声码器和MELP声码器都是成功应用LPC技术的典范。LPC-10声码器从1986年开始作为美国第三代保密电话语音通信标准;1997年MELP声码器以其高质量的合成语音代替LPC-10声码器,成为新的美国联邦标准。在衡量语音编码算法性能的指标中,最重要的是合成语音质量和算法的运算复杂度。但是这两个指标通常是相互矛盾的,如何在两者之间得到合理的折中,成为语音编码算法需要考虑的关键问题。另外,LPC-10与MELP语音编码算法之间并不兼容,导致采用这两种算法的通信系统间不能直接进行通信。这就必然要求一种码流转换方案完成两种算法体制的转换,实现它们之间的相互通信。论文从语音编码算法的基础出发,研究语音编码能够实现较低速率编码的理论依据。在此基础上深入研究MELP语音编码算法的实现原理,并在PC机上利用C语言在Microsoft Visual Studio 2003环境下仿真了MELP算法的编解码过程。利用ITU推荐的P.862算法(PESQ)评估了其语音质量。针对MELP语音编码算法计算复杂度高的问题,论文提出了利用快速搜索的树型矢量量化代替多级矢量量化的方法,降低编码算法的计算复杂度;同时通过优化过渡帧和优化提取基音周期等措施保证合成语音质量,使改进后的算法在合成语音质量和计算复杂度上得到折中。利用TI公司的开发软件CCS对改进后的代码进行优化后在TMS320C6418 DSP平台上实现改进后的声码器的算法功能。通过非正式主观测试及PESQ测试结果表明,改进的MELP声码器能够在2.4k/s的速率下获得较为理想的合成语音质量,具有较好的可懂度和清晰度。为了减少Tandem方式编码转换造成的语音失真,论文提出了参数直接转换方案实现MELP与LPC-10语音编码之间的编码转换。详细分析了LPC系数、基音周期、清浊音判决和增益等编码参数在不经过二次编译码的情况下,直接利用编码参数实现它们之间的码流转换过程。对转换以后的合成语音质量采用PESQ MOS技术给出了客观评价。结果表明,参数直接转换方案与Tandem方式转换结果相比,不但较好地保证了合成语音质量,而且有效地降低了程序的运算量。
其他文献
由于无线通信技术的快速发展以及对无线通信需求的增大,频谱资源如同其他不可再生资源一样越来越稀缺,已成为无线通信发展的巨大瓶颈。但是经过大量科研人员的研究却表明目前
本文设计了一种以单片机和FPGA为核心,可以对惯导组件输出的脉冲进行实时采集、处理的检测系统。利用串口与上位机进行数据传输,使用VHDL语言对FPGA芯片内部电路进行设计,具
图像Hash技术将图像数据映射为一个可反映图像重要视觉特征的简短二值序列,目前在内容认证、数字水印和图像数据库检索等领域有广泛应用。本文对图像Hash认证技术中的一些重要
X射线血管造影和血管内超声(IVUS)是目前临床普遍采用的诊断血管病变的介入性影像手段,二者具有优势与不足互补的特点。本文提出一种基于血管造影和IVUS图像融合的血管三维重
近年来,基于内容的视觉信息检索已经成为多媒体分析和理解中非常活跃的研究方向。在该领域的研究中,如何提取有效的特征对视觉信息的内容进行描述,以及如何设计合理的检索机
多跳ad hoc网络,即多跳无线自组织网络,是由一组带有无线收发装置的移动节点构成的无中心、自组织、多跳的对等式通信网络。网络中的所有节点地位平等,既是终端又是路由器。
伴随着无线通信技术的不断深入发展,频谱资源变得越来越紧张。不可否认的是,频谱资源并没有得到充分的利用,它的利用率一直是一个非常重要的指标。认知无线电作为一种有效提
动态磁共振成像数据是一组变化的图像序列,由于运动会导致磁共振图像出现伪影,所以动态磁共振成像通常要求减少采样K空间的数据,以提高磁共振扫描速度,便于寻求更高的磁共振
频谱匮乏已成为无线通信系统发展和应用的主要瓶颈之一,认知无线电通过感知无线通信环境,从环境中学习并根据环境的统计特性自适应调整工作参数,能提供可靠的通信和高效的频