具有高可懂度的维纳滤波语音增强算法

被引量 : 7次 | 上传用户:haihanzhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息社会的飞速发展,智能手机以及人机语音对话设备得到了广泛应用,从而语音信号受到越来越多的关注。然而语音信号在产生、传输、处理、接收的过程中不可避免因为周围环境和传输介质的影响而受到噪声的污染。污染严重的情况下会影响语音信号的质量和可懂度,导致人或者接收语音的设备无法听懂语音。因此,需要利用语音增强技术从带噪语音信号中分离出原始纯净的语音信号,滤除噪声。传统的语音增强方法都从语音质量方向入手,使增强后的语音具有较高信噪比。但是和带噪语音相比,增强语音的可懂度没有得到有效提高。这是由于传统增强算法在滤除噪声的同时也会滤除有用的语音信号,造成语音畸变失真。由于维纳滤波可以明显提高语音质量且使增强后语音含有较少音乐噪声,本文在维纳滤波算法的基础上提出一种具有较高可懂度的改进算法,旨在提高增强后语音的可懂度,使增强后的语音信号更容易被人或者语音设备听懂理解。本文首先介绍了语音信号的常识、人的听觉特性以及噪声信号的特征,然后系统的讲述了四大类语音增强算法。总结了对于增强语音进行评价的相关方法,包括主观测听评价方法,语音质量客观评价方法和语音可懂度客观评价方法。根据维纳滤波的推导过程,得到维纳滤波器的增益函数。之后详细介绍了基于先验信噪比估计的维纳滤波方法,此方法计算过程简单,且增强后语音的质量提升明显。通过对句子和辅音语料实验仿真得到此方法虽然提高语音质量,但没有真正意义上提高增强后语音的可懂度。分析增强语音未提高语音可懂度的原因,并从剩余信噪比出发研究得到增强语音幅度谱中存在衰减畸变和放大畸变,且幅度谱大于6.02dB的放大畸变会严重影响增强语音的可懂度。通过实验把原始纯净语音的幅度谱和增强语音的幅度谱进行对比,去掉幅度谱大于6.02dB的畸变区域,增强语音的可懂度和质量相比带噪语音得到明显提升。在现实处理语音的环境中不可能有纯净语音,这就需要通过对先验信噪比进行改进。修正先验信噪比小于-10dB区域进而修正滤波算法的增益函数,然后通过已有条件判定幅度谱大于6.02dB区域,并对此区域进行约束限制,最终得到具有高可懂度的改进维纳滤波增强算法。通过对句子和辅音语料的实验仿真证实改进的算法确实提高了增强后语音的可懂度。
其他文献
积叠式导电滑环采用全新的工艺方法 ,避免了传统的真空灌注环氧树脂方法易形成的气泡、裂纹、疏松等现象 ,保证了型号设备中导电滑环的绝缘性能 ,特别是在潮湿环境、高温、低
随着改革开放的深入和我国经济的发展,银行业在国民经济发展中起着日益重要的作用。银行业在新的环境下也面临着众多的机遇和挑战,经济的发展和人们生活水平的提高为银行业务
办公建筑能耗总量巨大,降低办公建筑的采暖空调能耗可以有效地缓解我国能源供给问题。目前,办公建筑采暖空调系统的运行普遍存在着效率低下等问题,粗狂式的调节已不能满足建筑节
在常压下随温度的变化,氧化锆可分别以单斜相(m)、四方相(t)和立方相(c)的形式存在。氧化锆陶瓷经表面处理(研磨或离子注入)或热处理后的XRD图谱中,(111)c或(111)t衍射峰出现不对
奥巴马2009年上台时,美国面临复杂的国际国内形势。布什政府遗留下来的外交困境,国际金融危机带来的巨大经济压力,美国在国际社会影响力下降,世界多极化不断发展,以中国为代表的新
<正>近期发生的"大众搬场诉百度"网络商标侵权一案提出了判断商标侵权的新问题。打开知名搜索引擎"百度",输入"大众搬场"4个字,跳出来的信息不下9.8万条,其中标榜"大众搬场"
面向并联机器人高速、高精和智能化的发展趋势,同时针对目前并联机器人开发周期长、成本高的现状,本文以国家自然基金重点项目“少自由度并联机构创新与系统集成设计”为依托,围
笔者于2012年11月随团前往美国学习考察,有感于美国文化的包容与厚重,更觉得美国职业教育的开放性具有一定的借鉴意义,因而提出反思中国的职业教育现状,吸收美国先进的职业教
在高校教师的科研绩效评价方面,美国高校制定了较为科学的评价指标体系、程序和方法,其评价结果为教师的薪酬调整、晋升和终身聘任等提供了有效依据。