有效提高语音可懂度的语音增强方法研究

被引量 : 5次 | 上传用户：lilunallen

【摘要】

：

现有语音增强方法在消除背景噪声、改善语音质量的同时，往往不能在低信噪比情况下有效提高语音的可懂度。为解决这一问题，本文首先对传统的统计模型方法进行改进研究，提出一种改

【作者】

：

李娜

【发表日期】

：

2013年01期

【关键词】

：

语音增强统计模型语音可懂度语音失真噪声过估计

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

现有语音增强方法在消除背景噪声、改善语音质量的同时，往往不能在低信噪比情况下有效提高语音的可懂度。为解决这一问题，本文首先对传统的统计模型方法进行改进研究，提出一种改进的β阶加权欧式失真测度（Improved β-orderWeighted Euclidean Distortion Measure, I-β-WEDM）幅度谱估计器，能够在较高信噪比环境有效提高语音质量。进一步，在研究现有语音增强方法对语音可懂度影响的基础上，结合对语音可懂度的相关影响因素的分析，提出了一种基于语音失真和噪声过估计受控的增强方法，能够有效提高低信噪比环境中的语音可懂度。本文的研究工作主要体现在以下几个方面：首先，对统计模型增强算法进行了深入研究。β阶最小均方误差估计器（β-order Minimum Mean Square Error, β-MMSE）可以通过估计器阶数的自适应选择控制噪声衰减量，但语音存在段的残留噪声较多；而WEDM估计器能够对谱峰谱谷分配不同的失真并有效抑制谱谷处的残留噪声，但不能根据需要控制噪声抑制量。结合两种估计器的优点，本文通过引入β阶WEDM形式的损失函数，并在临界带中利用子带信噪比更新估计器阶数，提出了一种改进的β阶WEDM（I-β-WEDM）语音增强方法。并且利用国际电信联盟标准部ITU-T（InternationalTelecommunication Union, Telecommunication Standardization Sector）G.160标准对上述方法进行了性能测试，测试结果表明，与传统方法相比，I-β-WEDM方法在有效抑制噪声的同时语音质量得到更大的提高。然后，本文研究了现有语音增强算法未能提高可懂度的原因，并对语音失真及噪声过估计对可懂度的影响进行了分析。根据研究结果及二值掩码（BinaryMask，BM）准则，本文通过对噪声估计和增益函数的调整，提出了一种基于语音失真和噪声过估计受控的语音增强算法（Constraints on Speech Distortion andNoise Over-estimation，CSDNO），以达到提高语音可懂度的目的。为了进一步抑制音乐噪声，根据不同程度的语音失真对可懂度影响的不同，对信噪比估计方法进行了修正，提出了一种改进的CSDNO方法（Improved CSDNO，ICSDNO）。本文所提方法有效地改善了低信噪比下增强语音的可懂度。最后，对基于CSDNO的增强算法进行了主客观的性能测试，包括G.160测试和语音可懂度测试两方面。G.160测试结果显示，与参考方法相比，CSDNO和ICSDNO方法语音电平损失较小，客观语音质量满足要求。语音可懂度测试分为基于频域加权分段信噪比（frequency-weighted SNR segmental，fwSNRseg）和分数清晰度指数（fractionalArticulationIndex，fAI）的客观测试和判断韵字测试（Diagnostic Rhyme Test，DRT）的主观测试两部分。测试结果显示，与参考方法相比，本文所提方法能够有效地减少语音失真，提高语音可懂度。另外，利用定点C语言实现了所提语音增强方法。

其他文献

基于供应链金融的小微企业融资研究

小微企业往往是创新型科技企业的载体,也是市场上大多数民营企业的选择所在,因此小微企业的发展既关系到增加就业,提高国民收入,改善国民生活条件;也关系到创新科技的发展。

期刊

供应链金融小微企业融资管理

中山大学提高医学生实践教学质量的实践与成效

针对目前临床教学资源不足、临床训练机会少、临床带教标准欠规范、教师教学水平不一、考核体系不规范等问题，本文以中山大学为例，概述了学校构筑高水平临床模拟平台、培养高素

期刊

医学教育三基三严三早三赛三新实践教学

安徽繁昌县老坝冲宋墓的发掘

<正> 1984年5月,在繁昌县城西郊柳墩老坝冲基建工程中发现一处古墓群,我馆及时进行了清理。其中十三座宋墓较具特色,分别编号为M1、M2、M3、M8、M9、M10、M11、M12、M14、M15

期刊

砖室墓高足杯繁昌窑繁昌县

42CrMo钢汽车前轴淬火开裂原因分析及改进措施

　　对42CrMo 钢重型车前轴锻件的淬火裂纹形态、材料常规及残留微量元素成分、显微组织等进行了观察与分析。结果表明，钢中残留的硼含量异常是造成工件淬火开裂的主要原因，同

期刊

重型汽车前轴淬火开裂硼含量带状偏析

试论唐长安城大明宫麟德殿对日本平城京、平安京宫殿设计的影响

<正> 日本8世纪的都城平城京和8世纪末、9世纪以降的都城平安京,其形制、布局皆模仿中国唐代的都城长安和洛阳,尤其以对长安城的模仿更为显著。平城京和平安京的宫城(各称平

期刊

大明宫麟德殿平城京平安京丰乐院西宫

初中生数学学习“出错”背后的心理原因探析——以数学解题出错为例

初中生学习出错是正常现象,最为师生所关注的是解题出错.从学习心理角度分析,学生出错的原因有感知“粗糙”、注意力迁移与思维定式水平低下等原因.据此提出的矫正策略有加

期刊

初中数学学习解题出错心理原因矫正策略

利多卡因、肾上腺素和干扰素联合冷冻一次性治愈多发难治性寻常疣1例

本研究用利多卡因、肾上腺素和干扰素局部注射后行冷冻治疗,一次性治愈1例多发难治性寻常疣。患者,男,28岁,双手部长丘疹3年,双手背、手掌及额部多发大小不等角化粗糙丘疹,据

期刊

利多卡因肾上腺素干扰素局部注射冷冻

韦骧及其诗歌研究

韦骧（1033—1105），字子骏，钱塘（今杭州）人。韦骧在北宋中后期的政治、文学上有一定的声名，现有文集十六卷，其中诗歌七卷，共一千一百六十五首，但一直以来并未引起学界的重视。本文力图对

学位

韦骧儒学复兴党争心态雅自然宋诗化

江西景德镇市明清御窑遗址2004年的发掘

2004年对景德镇明清御窑遗址继续进行发掘,发现了墙、窑炉、埋藏瓷器的小坑等遗迹,出土了瓷器、窑具、制瓷工具等遗物。这对研究景德镇明代御器厂的发展、变迁、烧成技术及其

期刊

江西景德镇市御窑遗址窑炉瓷器明清时期

动力工程多相流国家重点实验室

期刊

多相流国家重点实验室传热传质

有效提高语音可懂度的语音增强方法研究

与本文相关的学术论文