论文部分内容阅读
嵌入式变速率语音编码器是近年来语音编码领域的研究热点。2007年,北京工业大学语音与音频信号处理实验室开发了一套完整的嵌入式变速率语音编码器,作为候选编码器提交给ITU-T,参与了GVBR国际语音编码标准的竞争。
本文对嵌入式变速率宽带语音编解码器的关键技术环节进行了研究,在上述候选编码器的基础上,针对系统的特点,提出了相应的改进算法和方案,提高了合成语音质量,降低了编解码复杂度,并进一步完善了系统功能。
在谱参数计算量化方面,本文构建了一种基于安全网技术的矢量量化系统,在保证帧丢失恢复效果的基础上,明显地降低了量化的平均谱失真,提高了谱参数的量化精度。同时,本文通过增加计算量化中间子帧谱参数,从整体上提高了谱参数的计算精度,比较明显地提高了合成语音质量。
在代数码书搜索方面,本文设计实现了一种三脉冲的深度优先树搜索算法,替代原全搜索算法和集中搜索算法,在保证合成语音质量的前提下,显著降低了代数码书搜索复杂度。
在激励信号重建方面,本文提出了一种增强一层激励信号增益的优化方法,对增强一层激励信号起到了一定的改善作用。
本文对TCX编码层的层间编码结构进行了调整,改用累积频域系数矢量的方式实现嵌入式,同时对TCX编码流程进行了简化,在保证合成语音质量的前提下,显著的降低了编码器的复杂度。
本文针对编码器的特点,设计实现了相应的VAD和DTX算法,使编码器具备了非连续传输功能,降低了系统的平均编码速率,完善了系统的功能。
相关的测试表明,改进后的编码器,在编码复杂度上,比原编码器降低了50%以上,在合成语音的平均客观MOS(MeanOpinionScore)分上,有了比较明显的提高,并基本保持了原编码器低延时的优点。