基于自适应子带功率谱熵静音检测的G.729改进算法

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:revire
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字移动通信和多媒体通信技术的飞速发展,需要有低码率的语音编码器来解决宽带资源的限制。研究者们相继推出了多种基于参数编码和混合编码的中低码率的语音编码器,国际电信联盟根据当时的研究成果和需求不断推出新的语音编码标准,为语音编码的研究成果的广泛应用做出了巨大的推动作用。G.729算法是国际电信联盟于1996年获准通过的采用CS-ACELP技术的具有8kb/s编码速率的语音编码建议,广泛应用于多媒体通信、蜂窝移动通信、IP网络电话中。CS-ACELP编解码器基于码激励线性预测(CELP)语音编码模型,该模型包括LPC分析、矢量量化、共轭结构代数码本和感知加权滤波等关键技术。该算法压缩效率高,合成语音质量好,但算法本身较为复杂,没有充分利用通信中话音不连续的特性。而且G.729只能采用固定码率,不能根据网络实际情况进行调节。针对G.729没有利用谈话中间隙的特点,在没有增加算法复杂性的的基础上,提出了基于自适应子带功率谱熵的静音检测算法对G.729加以改进。自适应子带功率谱熵法是一种新的端点检测方法,在不同的背景噪声下,该方法具有很好的鲁棒性。本文首先详细介绍了G.729的编解码原理,在研究经典的静音检测技术基础上提出了自适应子带功率谱熵的方法,并且在实验室条件下进行了仿真测试,实验结果表明了在不增加G.729复杂度和运算时延基础上,充分利用了电话交谈中的间隙,提高了语音压缩算法的压缩率。
其他文献
随着近年来多媒体技术的飞速发展,许多应用领域对视频图像的实时压缩提出了更高的要求,快速、高效的压缩算法是解决这一问题的关键。运动估计作为实现视频压缩的核心技术,也
学位
如今,数据业务的迅猛发展推动了电信传送网络向着高带宽和多业务的方向发展。光传送网络的引入使得传送网络获得了潜在的无限带宽。在这样一种高速、多业务的光传送网中出现任
近年来,随着人们对安全方面越来越高的需求,视频监控得到了越来越广泛的应用,人们对于数字化视频监测系统的要求也随之提高。但是在恶劣环境下,通过视频监测系统获取图像的质
MIMO技术与OFDM技术作为第四代移动通信系统的关键技术,广泛应用于各种无线通信系统中。然而,其较好的系统性能建立在已知发送端信道状态信息的基础上。有限反馈系统能够为发送
图像语义标注作为图像场景理解的核心之一,已成为图像处理与计算机视觉领域的研究热点。室内场景存在大量语义类别、互相遮挡、低层视觉特征辨识力较弱以及不均匀光照等问题,
随着互联网这个新兴的信息传递媒体的迅猛发展,互联网信息急剧膨胀,如何从海量网络电子文档中及时准确地找到需要的信息己经成为一个函待解决的问题,信息抽取正是在这样的背景下
“大数据”(Big Data)时代的到来带来了飞速增长的信息量和信息处理任务。传统的奈奎斯特采样定理提出的最低采样速率在面对超宽带信号或冗余度较高的信号时,不仅在采样端处
随着技术的不断发展,日益成熟的视频监控系统广泛应用于各个行业用户并逐步向个人用户扩展。视频压缩算法作为视频监控系统中核心技术之一,直接影响视频监控系统的性能和整体
期刊