论文部分内容阅读
当今社会,通信技术和计算机网络都得到了迅速发展,视听需求量也越来越高,一方面,由于带宽为300Hz-3400Hz的窄带语音所提供的语音质量,已经不能满足使用的需求,人们开始转而研究带宽为50Hz-7kHz的宽带语音所提供的那种自然的、面对面的语音质量;另外一方面,由于传统意义上的语音编码,它的速率一般是确定的。如果它的编码速率较高,虽然能够获得较好的语音质量,但网络资源占用的多,而如果它的编码速率较低,虽然网络资源占用的不多,但是语音质量又得不到保证。为了解决网络资源和语音质量之间的矛盾,出现了变速率语音编码。综合以上两个原因,将宽带语音编码和变速率语音编码相结合就成为了语音编码技术的发展趋势。AMR-WB语音编码器作为宽带语音编码和变速率语音编码的结合体,,被ITU-T和3GPP/ETSI同时选中作为宽带语音编码标准,在通信史上,该编码算法第一次实现了无线与有线业务的融合,在移动通信、ISDN宽带电话、ISDN可视电话和电视会议等领域都有广阔的应用前景,所以对AMR-WB语音编码器进行研究有很深远的意义。本文针对AMR-WB语音编码器主要进行了以下几个方面的研究工作:(1)首先对AMR-WB语音编码器编码部分算法的原理进行了系统分析,深入研究了预处理模块、LPC分析模块、开环基音分析模块、码本搜索模块和增益量化模块,然后对AMR-WB语音编码器解码部分的算法进行了研究与分析,最后对AMR-WB语音编码器进行了C++编码实现,利用Visual Studio2008和ITU-T提供的语音序列tst.inp对AMR-WB语音编码器进行编解码实验,验证所编写代码的正确性。(2)虽然AMR-WB语音编码器具有语音质量高、平均编码速率低和自适应好等优点,但该算法的计算复杂度很高,这样就限制了其在计算资源有限的某些领域的应用。通过研究发现,LPC分析模块、码书搜索模块在AMR-WB语音编码器中就占了编码时间的60%,而矢量量化技术又是LPC分析模块中的一个关键环节。针对这一问题,本文在悉心总结前人研究成果的基础上,重点分析了矢量量化的码书设计、码字搜索和码字索引分配这三大核心技术,并对AMR-WB语音编码器中起着关键作用的矢量量化模块做了深入的研究,针对该编码器在进行矢量量化时,所存在的不足进行系统分析,并从码书设计和码字搜索上进行改进研究。(3) AMR-WB语音编码器中LPC分析模块的矢量量化是利用LBG算法来对码书进行设计的,初始码书设计的好坏直接影响着LBG算法的性能,而AMR-WB语音编码器中的码书设计存在收敛速度慢、运算量大等缺陷,针对这一问题,本文在分离平均初始码书设计的基础上,提出了一种新的初始码书设计——MR(Mean Ranking)算法,该算法首先以码书尺寸为依据,对训练序列进行分块,然后按照每一块均值的大小对训练序列由小到大进行重新排序,接着以训练序列大小和码书尺寸的比值为依据,对排序好的训练序列进行抽样,抽样出来的码书作为初始码书,从而实现了对LBG算法中初始码书的改进。本文所提出的MR算法中,把均值作为聚类的条件,从而能够以较大的概率求出相似量的聚集,并和随机法及分离平均法进行比较,结果表明改进后的方法能够在保证较好的码书质量前提下,以比较快的速度得到最终码书,从而证明了所提算法在减少码书迭代次数上的有效性。(4)AMR-WB语音编码器矢量量化中的码字搜索采用的是全搜索算法,该搜索算法虽然搜索精度较高,但在搜索码字时需要计算输入矢量与所有码字的失真距离,这样就导致该算法码字搜索效率低下、码字搜索耗时、复杂度高等问题。为了解决这一问题,本文提出一种改进的基于部分失真的快速码字搜索算法,该算法对部分失真搜索算法中的初始匹配码字进行训练,使码字搜索开始于和目标矢量相接近的一个码字。仿真结果表明,本文提出的算法可以在保证语音质量不下降的前提下,使语音编码算法的复杂度得到显著降低,从而减少码字搜索时间,使AMR-WB语音编码器的效率得到提高。