论文部分内容阅读
现如今针对语音增强方法的研究已持续近四十年之久,虽已有一定研究成果及贡献,但增强效果始终无法达到令人满意的结果。传统谱减法计算复杂度较低且易于实现,但增强后的语音信号新引入了“音乐”噪声,严重影响了主观听觉质量。维纳滤波算法虽具有较好的增强效果,但增强后的语音信号存在一定失真且伴随真空感的出现。上述两种方法适用于处理平稳噪声,但对于非平稳噪声的处理却略显乏力,为此一种名为码书驱动的语音增强算法应运而生,该算法基于谱失真测度准则,利用两个先验自回归(Auto-Regressive)谱包络码书估计出语音和噪声的AR谱,并将它们用于维纳滤波器中,得到增强的语音。由于该算法同时使用了语音和噪声的先验谱包络信息,且需对噪声信号进行预分类训练,因此不仅计算复杂度大而且实用性差,同时增强后的语音存在大量波动的背景噪声。针对上述问题,本文提出了两种基于码书驱动的改进算法和一种不需要任何先验信息的基于频域AR谱估计的语音增强算法。 首先,在原始码书驱动算法基础上缩减了语音谱形状码书的体积,并利用噪声估计算法取代了原始码书驱动算法中的噪声码书,使其可针对一般性噪声进行处理,随后利用谱间相关性对重构的维纳滤波器传递函数进行修正,达到进一步去除背景噪声的目的。 其次,为更好地保留弱语音成分,利用谱间相关性对谱失真测度准则进行修正,从而更好地考虑了语音谱、噪声谱与含噪谱之间的匹配关系,并利用线谱频率参数内插处理确保了合成谱帧间的平滑性。为更好地抑制静音段背景噪声,利用先验信噪比信息对重构的维纳滤波器传递函数进行了约束,从而进一步提高了增强语音的质量。 最后,为使算法计算复杂度更低且实用性更好,本文不再使用任何先验信息。语音和噪声信号分别通过谱减法和噪声估计算法求得,并采用频域线性预测分析法计算出相应的AR谱信息,从而保证语音和噪声谱的平滑性。并结合谱间的互相关系数有效地消除了传统谱减法所产生的背景“音乐”噪声和维纳滤波法引起的真空感。 本文利用分段信噪比,对数谱失真,PESQ(Perceptual Evaluation of SpeechQuality)对各种增强算法进行了性能测试。测试结果表明,本文所提出算法的性能均优于参考算法。