论文部分内容阅读
语音是最常使用的交流方式,然而噪声充斥在我们四周,大部分情况下噪声会降低语音质量,刺激听觉使人厌恶,降低人机交互的效率,因此抑制噪声的语音增强技术显得十分重要。随着麦克风阵列的广泛使用,基于麦克风阵列的增强算法受到越来越多的关注。本文研究内容分为两个部分:波束形成算法中的最小方差无失真响应(Minimum Variance Distortionless Response,MVDR)、后置维纳滤波,和联合对角化线性滤波(Variable Span Linear Filtering,VSLF)算法。传统的MVDR语音增强算法采用最小均方自适应算法更新权向量,不能很好跟踪语音统计特征的变化,导致语音增强性能一般,为此本文借鉴窄带波束形成中采样矩阵求逆(Sample matrix inversion,SMI)思路,以更新相关矩阵方式间接更新权向量,但采用的更新规则不同于SMI。改进算法将噪声相关矩阵变换为伪相干矩阵,采用了不同的权向量表达式。为提高改进算法的鲁棒性还使用了对角加载技术。实验表明,改进的MVDR算法在信噪比和PESQ得分两方面都优于传统算法。波束形成对于非相干噪声抑制能力有限,常配合后置滤波算法进一步抑制残留的噪声,传统后置维纳滤波算法基于非相干噪声场的假设,实际环境中噪声在低频的相干性强,因此传统算法在低频处会有较多的噪声残留,本文采用广义的不限于某一噪声场的期望信号和噪声先验功率估计方法,用以构造参变维纳滤波器,其中参变量与频率、信噪比相关,能够根据不同频段和信噪比自适应调整大小,用以补偿欠估计的噪声功率,提高噪声抑制程度。实验证明,改进的后置维纳滤波算法能有效抑制低频残留噪声,提高信噪比和PESQ得分。波束形成算法对DOA误差敏感,因此其它多通道算法引起学者们关注。VSLF是一类结合子空间思想的线性滤波算法,对期望信号和噪声的相关矩阵进行联合对角化得到特征值和特征向量,使用不同数目的特征值和特征向量便可以灵活地构造基于不同最优准则的滤波器,如最大信噪比滤波器、MVDR滤波器、维纳滤波器。本文第二部分工作对VSLF算法进行研究,提出时间递归平均(Time-Recursive Averaging,TRA)的噪声相关矩阵估计方法,并实现此类算法中的VS-MVDR。其算法自身具有多个可变因子,如麦克风数量、滤波长度、遗忘因子,本文在两种不同理想条件下通过实验探讨了它们对算法性能的影响,用以指导算法实现过程中参数的选取。实验表明本文提出的TRA方法比基于VAD的噪声相关矩阵估计方法性能更好,实现的VSMVDR能明显抑制噪声,提高语音质量;最后通过实际录制的语音测试算法性能,并与第一部分改进的算法进行对比,简要分析两类算法的优缺点。相比波束形成算法,VS-MVDR没有直接利用空间信息,对于相干噪声的抑制不够,但是在失真方面表现良好,而且不需要进一步处理就能消除非相干噪声。