基于语音增强及小波变换基音检测的LPC-MBE低速语音编码算法

来源 :吉林大学 | 被引量 : 0次 | 上传用户：usrijl

【摘要】

：

引言近几十年来语音编码技术发展非常迅速。目前2.4kb/s以上的编码速率其合成语音质量已得到人们的认可，并已得到广泛地应用。现在国内外研究的重点是突破2.4kb/s以下极低速率

【作者】

：

董婧

【出处】

：

吉林大学

【发表日期】

：

2004年期

【关键词】

：

低速语音编码多带激励语音增强二进小波变换

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

引言近几十年来语音编码技术发展非常迅速。目前2.4kb/s以上的编码速率其合成语音质量已得到人们的认可，并已得到广泛地应用。现在国内外研究的重点是突破2.4kb/s以下极低速率的语音编码技术和算法。由于LPC和CELP模型本身的局限性，它们在低速语音编码中难有更好的表现。因此，人们不断探索更有潜力的新算法。多带激励MBE（Multi-Band Excitation）低速语音编码算法正是在上述两种算法的基础上，克服了它们的缺点而提出的。多带激励语音编码技术多带激励语音编码算法的基本思想是按基音的各谐波频率，将一帧语音的频谱分成若干个谐波带，再以若干个谐波带为一组进行分带处理，然后分别对各带进行清浊音判决。对于浊音带，用以基音周期为周期的脉冲序列谱作为激励信号频谱；对于清音带，则使用白噪声谱作为激励信号频谱，根据不同的激励信号产生合成语音，最后将各带信号相加形成全带语音。二、语音分析在MBE核心算法的基础上，本论文对其进行了改进。首先，对输入语音进行分析，建立合理的语音模型并准确地估计模型参数。在语音模型中，合成语音所需要的参数包括：基音频率、谱包络信息和各带的清浊音信息。对语音信号进行预处理之后，首先做LPC分析来提取谱幅度系数。采用了时域中的共轭梯度算法进行参数估计，它可以精确快速地估计出每帧语音模型的参数，得到和做为表示语音信号的谱包络信息。针对自相关函数、平均幅度差函数等典型的基音检测算法存在着复杂度较高，检测不够准确等缺陷，本论文研究的小波变换模极大值基音检测法是一种有效的改进方案，对于输入的加窗语音序列采用Mallat快速算法进行离散二进小波变换，对信号做5阶小波分解，并检测每个尺度下模极大值的位置，相<WP=76>邻最大值之间的间隔即为语音周期。该算法有效的降低基音检测的复杂度，并能避开噪声的干扰，更准确的提取语音基音频率。清浊音判决的正确性在很大程度上影响合成语音质量。通过分带信号在频域上的波形不同来判定U/V信息。先对低通余量信号进行离散傅立叶变换，把它转换至频域。为了降低编解码器对语音基音的依赖性，将语音频谱划分为固定的9个子带，在每一子带上计算其自相关函数，根据信号频域波形有无明显的谱线结构来区分清音子带和浊音子带，获得清浊音信息。三、参数编码对于8kHz的采样率，以25ms为一帧，每帧200个样点，在一帧语音中，使用45比特分配技术，则传输速率约为2.0kb/s。采用6比特非均匀标量量化的方法对基音周期进行量化，对低频段分配较多码率以进行细致分析；根据语音分析时固定的分带数来确定采用9比特传递U/V信息；对于能量系数，将其开平方后转化到对数域进行线性量化，把其结果线性映射到[0，31]的范围中，取这个范围内与映射结果最接近的整数作为量化结果，并分配5比特进行标量量化。LPC系数的编码是参数编码的重点，由于其动态范围大，需要的计算量和存储量较多，需要转化为相应的等价形式LSF参数以保证合成滤波器的稳定性，采用了分裂矢量量化的方法。将一个10维的LSF特征矢量分裂成3个维数分别为3、3、4的低维矢量，然后对三个低维矢量分别进行矢量量化。采用LBG算法来得到所需要的三个码本，并通过全搜索方法从码本中搜索最佳码矢量来量化LSF参数。四、语音合成在语音合成端按清浊音分别对应的不同激励源构造激励信号，综合考虑时域和频域合成的优缺点，用频域合成法完成对清音带语音激励的重建。这种重建比较容易在频域中实现带通滤波器；采用时域合成法完成对浊音带语音激励的合成，以保证帧间语音的平滑过渡，叠加为全带激励信号后，将其作为合成语音的残差信号，经LPC综合逆滤波器得到最终合成语音。这样就产生了LPC-MBE 语音编码方案。这种编码方案不需要进行谱幅度重建，直接由LPC<WP=77>系数作为合成滤波器的参数分量，对残差信号做整体拟合更为简单方便。五、语音增强为了在噪声背景中提高LPC-MBE 语音编码器的性能，引入语音增强算法作为语音编码器的预处理器。采用双通道卡尔曼滤波的语音增强技术，信号与噪声模型的参数由共轭梯度算法进行估计，为在噪声环境下，尽可能提供纯净的语音作为语音编码器的输入提供了一种选择可能性。六、仿真结论在8kHz的采样频率下分别输入一段男声和一段女声，在计算机上采用MATLAB语言模拟仿真该语音编码算法。仿真结果表明，合成语音的波形同原始语音波形基本保持一致，从语谱图中可以看出语音能量的损失很小，主观测听效果较为理想，并基本上能满足实时通话需要。

其他文献

试论中医十大问题

ue＊M＃’＃dkB4＃＃8＃”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:（100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技

期刊

中医药发展中医现代化科学性

温度对316L不锈钢在硼酸溶液中腐蚀电化学行为的影响

采用动电位极化和电化学阻抗谱研究了温度对316L不锈钢在硼酸溶液中的腐蚀电化学行为的影响,并通过Mott-Schottky曲线考察了不同温度下钝化膜的半导体性质。结果表明,316L不

期刊

316L不锈钢温度动电位极化电化学阻抗谱Mott-Schottky曲线

民营企业绩效考核存在的问题探究

绩效管理是人力资源管理的重要环节,而绩效考核更是其中关键的环节.本文对民营企业绩效考核中存在的问题进行分析,并提出针对性的建议.

期刊

民营企业绩效考核人力资源管理制度化评价标准private-owned enterpriseperformanceassessment manageme

形位公差新旧国家标准的区别

本文指出了GB／T1182－1996《形状和位置公差通则、定义、符号和图样表示法》与GB1182－80、GB1183－80国家标准的主要差别，有利于国家标准在实践中的宣贯实施。

期刊

形状位置公差新标准旧标准

高效钙钛矿太阳能电池器件工作机理、界面电荷传输材料、稳定性研究

有机／无机杂化钙钛矿是一种有机组分与无机框架通过氢键自组装的晶体材料,兼具有机和无机组分材料的优点,因此在光学、电学和磁学等领域表现出了优异的性能。近年来,典型的有

学位

钙钛矿太阳能电池工作机理空穴传输材料电子传输材料界面修饰稳定性

离奇的灰洞

对于一个不懂万有引力和弯曲时空的人来说，黑洞已经足够离奇。最近，霍金又提出，黑洞并不存在，灰洞才存在。如果一个物体（天体）有足够大的质量，那么，在万有引力的作用下，它最终会坍缩成

期刊

万有引力弯曲时空黑洞天体质量物体

加强党内法规制度建设的现实路径及科学原则

党的十八届四中全会指出,必须完善党内法规制定体制机制,形成配套完备的党内法规制度体系,从而运用党内法规把党要管党、从严治党落到实处。近年来,党内法规制度建设取得了长

期刊

党内法规框架体系科学化

违法侦查行为及其法律对策

违法侦查行为的存在历史久远，不分国界。它的客观性和普遍性是促使笔者选择该论题的直接动因。顽疾经常被用作违法侦查行为的另一昵称，它总是与侦查相伴相随。为了创建法治国家

学位

侦查行为刑事诉讼法侦查主体实体正义律师在场权刑事诉讼活动法律对策非法证据排除侦查学程序规则

高中英语阅读课堂教师纠错反馈的研究

教师反馈是课堂对话教学的一个重要环节,其中教师纠错反馈是其主要的两种形式之一。在高中英语课堂中,教师纠错反馈体现为教师为了帮助学生达到英语输出的精确性而对其语言错误提供的信息。教师纠错反馈作为师生互动的桥梁,学生可以因此从教师处获得目标语的可理解性输入。基于教师纠错反馈对学生英语学习的重要性,本论文对北京Z高中的英语阅读课堂进行教师纠错反馈的个案研究,以提高教师纠错反馈的有效性。本论文主要通过课堂

学位

教师纠错反馈形式协商高中英语教学

基于网络技术的远程控制系统

网络技术的发展，引发了控制领域的深刻技术变革，控制系统结构沿着网络化方向与控制系统体系沿着开放性方向发展将是控制系统技术创新的大潮流。未来的控制系统以网络为主要特征

学位

远程控制网络套接字TCP/IPCOM/DCOMCORBAJava

基于语音增强及小波变换基音检测的LPC-MBE低速语音编码算法

与本文相关的学术论文