论文部分内容阅读
压缩感知(Compressed Sensing,CS)打破了人们对传统奈奎斯特采样定理认知的约束,可在低采样率条件下实现信号高质量的重建。低速率语音编码器采用参数编码技术,编码速率低,所需传输带宽小,可应用于卫星移动通信、水下通信和军事通信等领域。低速率语音编码技术是提高无线通信中频带利用率的有效方法之一,研究并实现具有较高合成语音质量的低速率语音编码器具有实际的应用价值。本文把CS理论用于语音特征参数的高效量化,解决了不同稀疏度语音信号的分类重构问题,并实现了一种速率为1kbps语音编码器。线谱对参数(Linear Sepctrum Frequency,LSF)是语音重要的声道模型参数,在编码过程中分配的量化比特数最多。为了用尽可能少的比特数实现对LSF的透明量化,本文提出了一种基于压缩感知的自适应重构算法(Adaptive Reconstruction Algorithm for Compressed Sensing,ARA-CS)。该算法首先对语音帧的LSF参数采用CS方法进行观测;在重构时,根据语音帧的清/浊类型,自适应地选择调整参数,根据不同的调整参数值确定感知矩阵的维数,利用线性方程求解或最小二乘法得到LSF参数的前一部分稀疏系数,后部分补0;最后进行稀疏反变换求得重构的LSF参数。该算法同样适用于连续多帧LSF参数的观测和重构。采用平均重构信噪比和谱失真性能指标对算法性能进行评估,测试结果表明,本文算法对浊音帧和多帧联合编码的LSF重构效果优于传统CS算法。本文在MELP编码模型基础上,采用多帧联合编码技术和本文提出的ARA-CS算法,设计了一个1kbps的语音编解码器。编码端把语音信号分为30ms长的子帧,连续2个子帧组成一个超帧,根据子帧的清/浊类型,将超帧分为4种结构,每种超帧结构用60bit进行量化编码。采用ARA-CS算法利用不同的调整参数对不同超帧类型的LSF参数进行观测和重构,得到低维的观测序列,再对其进行矢量量化编码。编码所需量化码本也通过ARA-CS算法训练,并根据调整参数调整码本维度。采用PESQ和DRT对所设计的编码器进行测试,结果表明,该编码器的平均MOS值为2.64,DRT得分为87.29%,合成语音具有较好的清晰度与可懂度。