麦克风阵列语音增强算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户：aiming7006x

【摘要】

：

【作者】

：

余国修

【出处】

：

西安电子科技大学

【发表日期】

：

2020年02期

【关键词】

：

语音增强麦克风阵列最小方差无失真响应后置滤波联合对角化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音是最常使用的交流方式,然而噪声充斥在我们四周,大部分情况下噪声会降低语音质量,刺激听觉使人厌恶,降低人机交互的效率,因此抑制噪声的语音增强技术显得十分重要。随着麦克风阵列的广泛使用,基于麦克风阵列的增强算法受到越来越多的关注。本文研究内容分为两个部分:波束形成算法中的最小方差无失真响应(Minimum Variance Distortionless Response,MVDR)、后置维纳滤波,和联合对角化线性滤波(Variable Span Linear Filtering,VSLF)算法。传统的MVDR语音增强算法采用最小均方自适应算法更新权向量,不能很好跟踪语音统计特征的变化,导致语音增强性能一般,为此本文借鉴窄带波束形成中采样矩阵求逆(Sample matrix inversion,SMI)思路,以更新相关矩阵方式间接更新权向量,但采用的更新规则不同于SMI。改进算法将噪声相关矩阵变换为伪相干矩阵,采用了不同的权向量表达式。为提高改进算法的鲁棒性还使用了对角加载技术。实验表明,改进的MVDR算法在信噪比和PESQ得分两方面都优于传统算法。波束形成对于非相干噪声抑制能力有限,常配合后置滤波算法进一步抑制残留的噪声,传统后置维纳滤波算法基于非相干噪声场的假设,实际环境中噪声在低频的相干性强,因此传统算法在低频处会有较多的噪声残留,本文采用广义的不限于某一噪声场的期望信号和噪声先验功率估计方法,用以构造参变维纳滤波器,其中参变量与频率、信噪比相关,能够根据不同频段和信噪比自适应调整大小,用以补偿欠估计的噪声功率,提高噪声抑制程度。实验证明,改进的后置维纳滤波算法能有效抑制低频残留噪声,提高信噪比和PESQ得分。波束形成算法对DOA误差敏感,因此其它多通道算法引起学者们关注。VSLF是一类结合子空间思想的线性滤波算法,对期望信号和噪声的相关矩阵进行联合对角化得到特征值和特征向量,使用不同数目的特征值和特征向量便可以灵活地构造基于不同最优准则的滤波器,如最大信噪比滤波器、MVDR滤波器、维纳滤波器。本文第二部分工作对VSLF算法进行研究,提出时间递归平均(Time-Recursive Averaging,TRA)的噪声相关矩阵估计方法,并实现此类算法中的VS-MVDR。其算法自身具有多个可变因子,如麦克风数量、滤波长度、遗忘因子,本文在两种不同理想条件下通过实验探讨了它们对算法性能的影响,用以指导算法实现过程中参数的选取。实验表明本文提出的TRA方法比基于VAD的噪声相关矩阵估计方法性能更好,实现的VSMVDR能明显抑制噪声,提高语音质量;最后通过实际录制的语音测试算法性能,并与第一部分改进的算法进行对比,简要分析两类算法的优缺点。相比波束形成算法,VS-MVDR没有直接利用空间信息,对于相干噪声的抑制不够,但是在失真方面表现良好,而且不需要进一步处理就能消除非相干噪声。

其他文献

巢湖麻鸭主要特性及放牧饲养管理技术

本文从形体特征、产蛋性能、产肉性能、繁殖性能等方面介绍巢湖麻鸭的主要特性,并总结其放牧饲养管理技术,包括加强苗期管理、加强放牧管理、适时“关蛋”、做好疫病诊治等方

期刊

巢湖麻鸭主要特性饲养管理技术放牧

《打花鼓》绢画中的人物服饰研究

《打花鼓》绢画,从其色泽、技巧风格以及绢地情况来看,应为宋代杂剧人物图。宋代杂剧人物图目前共发现两幅,另一幅是同藏于北京故宫博物院的《眼药酸》。二幅皆为散册,绢质,

期刊

常服打花鼓宋杂剧绢画女扮男装

两种热带作物锈菌LAMP分子检测技术的建立与应用

植物锈菌病害是危害农业生产的重要病害之一,发病率高,寄主种类多,经济损失大。其中甘蔗黑顶柄锈菌和咖啡驼孢锈菌是危害严重,发生比较普遍的两类专性寄生病原菌,前者引起甘

学位

甘蔗褐锈病菌咖啡叶锈病菌专性寄生菌LAMP

智慧零售模式下苏宁企业价值评估

随着科学技术的发展,人们的生活节奏变快,其消费方式也发生了巨大改变。苏宁易购作为电商龙头企业,为适应消费市场的发展,在不断探索新的零售模式。2017年苏宁提出了智慧零售商业模式并开始落地实施,这种零售模式对电商企业的影响和改变受到行业各界的关注。它的企业价值可以直观地反映苏宁智慧零售模式产生的效果。所以,对苏宁在智慧零售模式下的企业价值评估有一定的需求。通过对苏宁企业价值评估,管理层可以及时掌握企

学位

智慧零售AHP-模糊综合评价法EVA价值评估

用Hirota双线性法求Caudrey-Dodd-Gibbon-Kaeada方程的双孤子解

利用Painleve截断展开法得到Caudrey-Dodd-Gibbon-Kaeada（CDGK）方程的Hirota双线性形式，并根据其双线性形式，利用Hirota双线性方法求出了CDGK方程的单孤子解与双孤子解，并对双孤子

期刊

Painleve截断展开法Hirota双线性形式CDGK方程双孤子解

ABS融资在中国的发展前景及对策措施

资产支持的证券化融资（Ａｓｓｅｔ－ＢａｃｋｅｄＳｅｃｕｒｉｔｉｚａｔｉｏｎ）是近几十年来世界金融领域最重要的创新之一。随着世界金融市场的全球化和融资的证券化，资产支持的证券化融资已经成为项目融资的主要方式之一，在世界

期刊

资产支持的证券化项目融资应用前景对策

微文化视域下大学生社会主义核心价值观培育研究

2017年10月18日,习近平同志在党的十九大报告中提出要坚持践行和培育社会主义核心价值观,要以培育担当创建国家富强的时代新人为出发点,坚持三个倡导,坚持与时俱进。随着科学

学位

微文化大学生社会主义核心价值观培育路径

APACHE-Ⅱ评分在ICU患者转科中的应用

目的探索APACHE-Ⅱ评分在指导ICU患者转科中的价值,为ICU患者安全转科提供客观参考依据。方法回顾性分析我院493例由ICU转出的患者,按照患者转科结局将患者分为安全转科组

期刊

APACHE-Ⅱ评分ICU患者转科预后

门诊更年期妇女相关症状、行为和知识状况的调查

目的了解更年期妇女症状、行为和保健知识的状况,以进一步加强更年期妇女的预防保健工作。方法抽取2004年3月至4月就诊于北京协和医院更年期门诊的302例妇女,以问卷形式进行

期刊

更年期病人接受卫生保健的程度性行为

北京服务业利用FDI实证分析

<正>20世纪90年代以来,全球流入服务业的直接投资出现明显增长。联合国贸发会议《2006年世界投资报告》显示,2004—2005年,在发展中国家和转型经济体

期刊

FDI数据来源北京市服务业业绩指数实证分析

麦克风阵列语音增强算法研究

与本文相关的学术论文