嵌入式变速率语音编码中线性预测系数的矢量量化研究

来源 :北京工业大学 | 被引量 : 4次 | 上传用户:cet1979
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络技术的迅猛发展使得以分组交换为基础的IP电话技术得到了越来越广泛的应用。如何减小分组丢失对接收端合成语音质量的影响,已经成为语音编码领域亟待解决的问题。在此背景下,嵌入式变速率语音编码方法应运而生。国际电信联盟(ITU-T)于2005年提出了制定最新国际语音编码标准G.VBR的计划,使嵌入式变速率语音编码成为近两年来语音编码领域的研究热点。嵌入式变速率语音编码多采用码激励线性预测语音编码技术,这使得线性预测系数的量化成为至关重要的环节,量化的效果将会直接影响到整个编码器的性能。为此,本文就线性预测系数的矢量量化技术展开了深入研究。线性预测系数在量化之前,通常要转换成为线谱频率参数或导抗谱频率参数。在线谱频率参数矢量量化方面,本文提出了一种改进的基于哈德码变换的码书快速搜索算法,使矢量量化中码书搜索的速度相对于全搜索算法有了很大的提高。在导抗谱频率参数矢量量化方面,本文针对现有量化算法在处理语音分组丢失时效果不佳的问题,结合嵌入式变速率语音编码算法的特点,提出了三种应用于宽带导抗谱频率参数的量化方案。首先提出了一种改进的应用于宽带导抗谱频率参数量化的转换分类分裂矢量量化方案。该方案采用无记忆的量化方式,在编码比特数为42bits/frame时达到了透明量化的性能,但其唯一的缺点就是所需的码书存储量较大。针对此问题,本文又提出了一种转换分类乘积码锥形矢量量化方案。该方案在量化精度与复杂度之间进行了折衷,具有低复杂度、低存储的特点,在编码比特数为46bits/frame时达到了透明量化的性能。但是,考虑到应用于嵌入式变速率语音编码器中的导抗谱频率参数量化方案要在有丢失帧与无丢失帧时都具有尽可能好的量化效果,本文最后提出了一种各维非等系数帧间预测分裂矢量量化方案。该方案在无丢失帧的情况下用46bits/frame进行量化即可达到透明量化的性能,且在有丢失帧的情况下错误的延续性较小,实现了平衡有丢失帧与无丢失帧时量化性能的目的。最后,将本文提出的46bits/frame各维非等系数帧间预测分裂矢量量化方案应用到一种8~32kb/s嵌入式变速率语音编码器中。此编码器由本人所在的北京工业大学语音与音频信号处理实验室开发,并作为G.VBR候选编码器之一,由华为公司提交给ITU-T。实验结果表明,在纯净语音情况下该编码器基本达到了ITU-T对G.VBR候选编码器各层合成语音质量的要求。
其他文献
大部分被子植物的花粉在发育成熟后会进入代谢静止的状态。但当它们在风、动物等媒介的作用下接触到柱头时,能够迅速复水,萌发形成一个极性生长的花粉管,将精细胞准确的输送到胚
现代语音识别系统广泛采用隐马尔可夫模型(HMM),连续密度分布的HMM模型出于计算量的考虑和模型的简化,往往把协方差矩阵假定为对角阵,但这无疑会降低识别性能。在确保语音信
能源植物麻疯树(Jatropha curcas L.)含油量高,能在贫瘠的土地上生长,但其种子含有毒物质佛波酯,限制了其广泛种植和利用。本论文以麻疯树为研究材料,从脂肪酸合成、胁迫耐受性和
氧化锌(ZnO)是一种宽禁带Ⅱ-Ⅵ族半导体材料,由于其优良的物性,ZnO材料在光电、压电、气敏、压敏等领域有着广阔的应用前景。优良的性能和广泛的应用使人们对各种.ZnO材料的制备
脉冲信号波形的传播特性是超宽带无线通信中一个重要的子课题。本论文研究了脉冲信号在超宽带单极予天线与传播空间组成的“广义信道”中的传输特性,提出了一种实验测量结合数
PDP高压驱动芯片分为列寻址芯片和行扫描芯片,一般输出电压在60V~200V的范围内,单路的最大驱动电流从40mA到1A不等。由于芯片的功耗大,工作时会产生大量的热量,使芯片的温度升
珍稀植物是物种多样性的重要组成部分,对其准确分类鉴定是保护生物学的一项重要基础内容。水松(Glyptostrobus pensilis(Staunton ex D.Don)K.Koch)是第三纪孑遗植物,也是我国
在真核细胞中,微丝骨架的动态性对细胞的诸多生命活动,例如细胞迁移,膜泡运输,有丝分裂等有着重要的意义。这些生命活动的正常发生需要微丝聚合的准确的起始和正确的微丝结构,Arp2
减数分裂后的花粉发育涉及精细调控的细胞分裂和细胞分化,在此过程中,单核小孢子先经过第一次花粉有丝分裂形成二核花粉,再经过第二次花粉有丝分裂,最终发育为三核花粉。蛋白质翻
学位