论文部分内容阅读
在获得语音信号的同时,不可避免地会受到噪声干扰,语音增强是抑制干扰的一种有效途径。采用单麦克风技术,虽然可以对噪声进行一定的抑制,但由于仅可利用时/频信息,因此,在强混响环境以及非平稳噪声场情况下,其干扰抑制效果并不理想。利用多个麦克风提供的空域和时/频信息,则有可能较好地解决这一问题。因此,本文主要研究基于麦克风阵列的语音增强方法。时延估计和语音活动检测(Voice Activity Detection,简称VAD)技术是阵列增强的重要组成部分,其准确性直接影响到语音增强效果。独立分量分析(IndependentComponent Analysis,简称ICA)能够仅由观测信号恢复出各个统计独立的源信号,利用它可以一定程度上将语音与噪声分离,将其与现有算法相结合则有可能达到更好的增强效果,因此本文重点做了以下几方面工作:(1) 研究了互功率谱相位(Crosspower Spectrum Phase,简称CSP)时延估计方法的性能,针对该方法在低信噪比和强混响情况下性能下降的问题,给出了两种改进方法。实验结果证明了两种改进方法的有效性和可靠性。(2) 给出一种对麦克风阵列各通道信号同时进行VAD的算法。经ICA分离出的相对纯净的语音信号作为参考信号,其VAD结果用于指导阵列信号的语音检测,实验结果表明该方法在恶劣的噪声环境下仍可以获得准确的检测结果。(3) 针对实际环境下噪声和混响对语音增强系统性能的影响,在广义旁瓣抵消器(Generalized Sidelobe Canceller,简称GSC)基础上,将带参考信号的ICA(ICA withreference,简称rICA)算法与鲁棒性广义旁瓣抵消结构(Robust GSC,简称RGSC)相结合,给出了一种改进的GSC算法。通过实验表明,该算法综合了rICA的抗混响性能和RGSC方法对噪声的鲁棒性,更适用于实际环境下的语音增强系统。