基于模型的语音增强方法及质量评估研究

来源 :武汉大学 | 被引量 : 8次 | 上传用户:kusoyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据对语音信号处理方式的不同,语音增强算法可以分为两类:基于模型的方法和非模型的方法。相对于基于模型的增强方法,非模型的方法在一些方面有不足之处。有些非模型的方法需要两个麦克风,分别做为噪声和语音的输入。但是通常这是很难实现的,特别是某些需要实时处理的应用,比如在助听器上的应用。非模型的方法的一个较大的缺点在于必须假定噪声是相对平稳的,当噪声变化过快时,其效果不能令人满意。而且有些非模型的方法还会引入音乐噪声,比如常用的谱减法。基于模型的方法利用语音信号在时域中的统计特性或短时相关特性等来研究具有针对性的噪声消除技术。基于模型的方法从其增强机理就避免了音乐噪声的产生,可以很好地处理非平稳噪声。本文以随机信号处理技术作为理论工具,采用动态模型对语音建模,研究了几种基于模型的语音增强方法,其目的是改进现有语音增强算法的性能。另一方面,本文还对语音质量的主观和客观评价方法进行了研究。全文的主要研究内容如下:1.在子带H∞滤波构架上,提出了一种结合人耳听觉掩蔽特性的单通道语音增强方法。该方法不用对激励噪声和附加噪声的统计特性做出假设。将语音信号分解为子带信号,采用迭代H∞滤波估计出子带信号的低阶AR参数。在对子带噪声进行估计时引入噪声掩蔽阈值,提高了H∞滤波的效果,减少了语音失真。仿真实验结果表明,该算法不仅降低了计算量,而且在主观和客观测试中都获得了更好的增强效果。2.由于发音的差异或发声方法的差别,不同说话人对同一音素发音时能级并不相同。HMM模型并不能明确地描述这种差异。在HMM模型的框架下,通过对语音增益的参数化和建模来解决上述问题。语音HMM模型和时不变的增益参数通过训练数据在离线时得到,而时变的参数通过观测到的带噪语音在线更新。通过并行的H∞滤波器对带噪语音进行处理,由滤波器输出的加权和计算出对干净语音的估计。引入IMM(交互式多模型)算法使并行的滤波器能有效地交互,在不显著增加计算复杂度的情况下改进增强性能。通过实验表明,文中提出的增强方法能有效地去除背景噪声,处理后的语音失真也比较小。3.针对含有色噪声的语音,提出了一种基于Unscented粒子滤波的单通道语音增强方法。采用时变AR模型对干净语音和噪声建模,通过Unscented粒子滤波器估计AR模型的参数并滤除有色噪声。与大多数常用的粒子滤波选择的建议分布不同,Unscented粒子滤波器采用Unscented卡尔曼滤波器生成粒子滤波的建议分布。由于在粒子的更新过程中考虑了最近的观测值,Unscented粒子滤波器能够在粒子数少于传统粒子滤波算法所需粒子数目的基础上改善估计的性能。仿真实验结果表明,在有色噪声背景下该算法具有良好的语音增强效果。4.为了预测经过增强算法处理后的语音质量,评估了几种客观测度的性能。在对干净语音混入三种噪声,分别对六类增强算法进行增强处理,并通过文中介绍的客观测度测试增强算法引入的失真。对增强后的语音质量进行主观测试时采用ITU-T P.835中提出的主观测试方法,从语音信号失真等级、背景噪声等级和语音整体质量三方面评估增强后的语音质量。最后,采用多元自适应回归分析技术得到与主观质量高度相关的一种新的组合客观测度。5.提出了一种新的基于GMM-HMM模型和非均匀线形预测倒谱系数的客观语音质量评估方法。提取干净语音的非均匀线形预测倒谱系数用来对GMM-HMM模型进行训练。通过训练给干净语音建立参考模型。由参考模型和失真语音的非均匀线形预测倒谱系数向量可以得到它们之间的一致性测度。最后,通过多元非线性回归模型建立主观MOS分和一致性测度之间的映射关系,可以得到对MOS分的客观预测模型。通过这一模型进行语音质量的客观评价,实验表明,文中所提出的基于输出的客观语音质量评估算法的性能要好于ITU-T P.563标准中提出的算法。
其他文献
在不同生产水平条件下及不同的气候变化周期中,影响作物产量的关键期和关键因子也必不相同。分段寻找影响湛江早稻产量的关键期和关键因子,利用模糊数学的综合评判法,分段建立湛
作为一个前厅管理员深知国贸酒店前厅对于酒店的重要性,而人力资源在前厅里显得更加重要。现代社会快节奏生活,小到白领出差,大到旅游团接待,这一切与酒店有着密切的关系。一
在我国城市化发展节奏较快的今天,城市人口的快速增长也相应带动了建筑事业的发展。伴随着这种高密度的建筑多层多功能化的发展,对于火灾事故的发生频率也有较大影响。在公共娱
新日电动车通过环保骑行形式,并结合快闪舞蹈等,以一种活泼有趣的方式与市民互动,号召全民选择电动车绿色出行方式,为绿色、健康、环保事业继续贡献力量。除此之外,新日电动
微博改变生活,对于酒红冰蓝来说,这种改变更加实在。2010年秋天创业成立公司时,酒红冰蓝还需求助朋友才凑齐了10万元的注册资金,时隔不足一年,“年初我希望每天的净利润能达到1万
1临床资料  杨某某,男,46岁,右眼视物不清半年余,于2007年1月10日来我院就诊.检查:视力右眼0.04,检影+10.00/-21.00×100=0.1,左眼0.6,-0.50×105=1.0.双眼结膜稍
期刊
全国未达到基本消除碘缺乏病标准的7个省(区)中,新疆病情最重,仍有35个边远贫困县(市)未达到基本消除标准,阿克苏地区8县1市中有8个县未达到国家消除标准。边远贫困地区一直
随着市场竞争的日益激烈,以及外资银行的不断涌入,国内银行市场已然面临严峻的挑战。因此,如何赢得新客户,留住老客户,从而扩大银行的市场占有率成了当前中国商业银行迫在眉
日本和印度是亚洲地区两支不可忽视的力量。二十世纪,日印关系受到世界局势变化的影响而有所起伏。进入新世纪后,日印关系进入新的机遇期,双边关系迅速升温。政治领域,以2006年底两国确立“全球战略伙伴关系”为节点,在此之前两国关系总体来说发展趋势较为平稳,之后快速升温。经济领域,新世纪以来日本对印度的经济援助数额迅速提高,主要用于印度的基础设施建设以及改善环境与基层民生。在双边经济贸易上,无论是日印之间
本文用巯基棉分离、二乙基二硫代氨基甲酸银(简称Ag-DDC法)光度法测定了用1MHCl提取的土壤提取液中三价、五价砷的含量。结果表明:在1MHCl的土壤提取液中的三价砷在巯基棉上