论文部分内容阅读
极低速率语音编码技术在军事通信、保密电话等领域有着十分重要的应用。在军事、卫星通信系统中,信道的资源十分紧张、带宽很小、信道质量较差、干扰也很严重,因此需要尽可能地降低语音编码速率来保障数字保密语音通信系统的可靠性,以提高军事通信系统的整体抗干扰能力。在低速率语音编码算法标准中,2400bit/s的混合激励线性预测编码(Mixed Excitation Linear Prediction,MELP)是一个十分优秀的语音编码算法,本文研究的重点就是在MELP算法基础之上,通过矢量量化的方法将语音编码的速率降低到800bit/s。
首先,本文根据TIMELP声码器的C语言实现以及相关的一些论文,对2400bit/sMELP算法的参数提取以及语音合成过程作了详细的分析。然后,根据矢量量化的思想,将4帧MELP子帧联合为一个超帧,设计出了两种不同的800bit/s声码器方案。
方案一的算法较简单,算法将4个MELP子帧联合为一个超帧,然后对超帧用72比特进行量化,从而得到800bit/s的语音编码速率。对于傅立叶级数幅度值以及抖动标志这两个参数,算法在编码端不进行量化和传输,在合成端则生成幅度平坦并强制不抖动的激励来合成语音;对于线谱频率(Linear Spectrum Frequency,LSF)参数,算法对第二个和第四个子帧采用和MELP相同的方法进行量化和传输,而对第一个和第三个则不进行量化和传输,在合成端通过线性插值的方法进行恢复;对于基音周期、增益、子带声音强度三个参数,算法将其分别联合为4维、8维、16维的矢量,然后分别进行矢量化处理。该方案声码器的语音质量客观感知得分(Perceptual Evaluation Speech Quality,PESQ)为2.324(男)、2.141(女),而2400bit/sMELP声码器对应的PESQ得分为2.964(男)、2.705(女)。
方案二的算法仍然是将4帧MELP子帧联合为一个超帧,然后对超帧用72比特进行量化。不同的是,方案二对超帧的模式进行了划分,其根据超帧包含浊音帧数目的多少将超帧分为5种模式。对于不同的模式,比特的分配方案以及矢量量化的方法均不同。本质上该方案是构建了更精细的码本,从而提高语音的合成质量。该方案的PESQ得分为2.657(男)、2.431(女),由此可见方案二声码器的语音合成质量要明显优于方案一的,并且也更接近2400bit/sMELP声码器的语音合成质量。