8kbit/s低延迟语音编码算法研究

来源 :太原理工大学 | 被引量 : 5次 | 上传用户:shoretxm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
低码率、低复杂度的LD-CELP算法在通信领域具有十分重要的意义。G.728是目前低延迟码激励语音编码算法中唯一的16kbit/s的国际标准。本研究以降低码率为目的对G.728算法进行改进,提出了三个延迟为2.5ms的8kbit/s的语音编码算法。实验表明,提出的改进算法在主客观质量上均接近于G.728的水平。低延迟的语音编码算法必须采用实时基音检测,到目前为止基音检测都是基于帧长20ms以上的长延迟算法,不满足实时性要求。因此G.728算法无法采用基音检测。所谓实时基音检测,是指连续监测每帧采样信号,当采样的一帧样点里存在一个基音脉冲时,立刻将它检测出来并计算基音周期。利用小波变换,本研究设计了帧长2.5ms的实时基音检测算法。依据小波变换的多分辨率能力发现第4阶小波系数极值与信号突变点之间存在强相关。以此为基础设计了基于小波变换的语音基音周期实时检测算法。该算法对语音信号分帧处理,通过结合小波域波形和时域波形,采取自适应基准、多特征参数提取小波系数极大值来确定基音周期。该算法在准确检测信号峰值点的基础上,精确提取基音周期,可以同时检测到基音周期的值和起止点,是本文后向基音预测8kbit/s低延迟编码算法的基础。本研究在G.728中引入自适应码书结构,自适应码书由最近的历史激励构成。算法采用归一化的固定码书。训练固定码书时,根据其使用频率对固定码书进行优化设计,通过迭代求出最佳固定码书。增益量化时对自适应码书采用固定量化方案,固定码书采用自适应量化。本文比较了三种延迟为2.5ms的8kbit/s编码方案:方案一采用全搜索模式,对128个自适应码矢、8个增益值和128个固定码矢、8个增益值的全部组合进行搜索,获得最佳的码矢标号和增益;方案二在连续的两帧里对自适应码书采用不同搜索模式:偶数帧的搜索与方案一相同;奇数帧的搜索仅在偶数帧得到的自适应码矢标号前后的小范围内进行;方案三在方案一的基础上增加了后向基音预测,在自适应码书中依据基音预测值确定64个码矢作为搜索对象,并将节省的1个比特用于扩大固定码书尺寸,从而进一步改善编码算法的主客观质量。
其他文献
安全一直是煤矿生产的核心内容。我国煤矿安全事故时有发生,造成了巨大的人员伤亡和财产损失,安全生产是煤炭行业的迫切需求。煤矿安全监测系统可以在煤矿安全生产中发挥巨大
随着数字化油田的实施与推广,油田智能化已成为当今数字化油田建设的发展趋势。在物联网的技术支撑下针对某采油区生产过程、工艺特点、设备状况以及管理现状,研究了智能化井
伴随着计算机网络的发展,网络结构日益复杂,规模不断扩大,网络管理的作用和地位也越来越突出。基于Web的网络管理融合了Web技术和现代分布式网络管理技术,可以使用户方便简单
期刊
网络教育是当今国内外教育发展的热点,也是现代教育技术的主流发展方向之一。为了更有效地建设教育资源库,促进教育资源的充分共享,提高教育资源检索的效率,保证资源建设的质
链路自适应技术能根据无线信道的时变特性,在保证一定通信可靠性的前提下,尽可能的提高频谱利用率。因此,在频谱资源日益紧张的今天,链路自适应技术逐渐成为研究的热点。 本文
布料的动态模拟是计算机动画的重要组成部分,在动漫影视、三维网络游戏及虚拟服装上都有着广泛的应用。布料模拟的目标在于模拟布料真实的形变效果,研究涉及到计算机图形学、
期刊
最早的射频识别技术(Radio Frequency Identification,RFID)源于20世纪90年代,它是人类在科技发展道路上的重大进展,改变了人类的消费方式与习惯。随着射频识别技术的逐渐成熟,该技
现场总线控制系统(FCS—Fieldbus Control System)是开放系统网络,又是全分布控制系统。它作为现场设备的联系钮带,可与因特网(Internet)、企业内部网(Intranet)相连,把总线