论文部分内容阅读
现实生活中,语音通常会受到环境噪声的污染,使得许多语音处理系统的性能急剧恶化。语音增强作为一种有效的预处理技术,通常应用于其它语音处理系统的前端处理中。语音增强的目的就是消除环境噪声的影响,改善语音的质量。基于时域滤波器的语音增强方法通常是在时域某种误差准则下的语音信号估计方法,是目前应用最广泛的方法之一。这种语音增强方法通常需要获得精确的参数估计,然后在时域某种误差准则下获得期望的估计语音。本文立足于跟踪国内外的最新技术,系统地研究了基于时域滤波器语音增强方法中的各个技术环节,主要实现工作如下:1.由于直接判决法只是利用了当前帧和当前帧之前的信息,这样得到的结果对于信号的突变不能很好的估计,并且这种方法在低信噪比区域的平滑程度也不够。因此在维纳滤波语音增强方法中,采用直接判决法不能够准确地估计出先验信噪比。针对上述两个缺点,本文提出了一种基于非因果先验信噪比估计器的维纳滤波语音增强方法,这种方法是利用了当前帧之前、当前帧和当前帧之后的信息来联合估计先验信噪比。由于利用了当前帧之后的信息,这种方法能够对信号的突变进行很好的估计,并且在低信噪比区域对后验信噪比进行了深度平滑。实验结果表明,采用本文的方法能够获得更好的增强效果。2.卡尔曼滤波语音增强方法是利用语音生成模型,在最小均方误差准则下,跟踪干净语音的方法。对于这种语音增强方法而言,模型参数估计的准确与否,直接影响到语音增强的质量。由于卡尔曼滤波语音增强方法需要获得干净语音的线性预测系数,因此需要先对带噪语音进行预处理。针对谱减法处理带噪语音后在频谱上出现随机尖峰的缺点,本文给出了一种短时对数谱幅度的MMSE估计(MMSE-LSA)和卡尔曼滤波语音增强相结合的方法。实验结果表明,采用本文的方法优于谱减和卡尔曼滤波语音增强相结合的方法。