论文部分内容阅读
抗噪声的语音识别技术是语音识别系统走向实用化的一个关键性难题。目前的语音识别系统在实验室环境下,可以达到非常高的识别精度,但是无处不在的噪声会带来训练环境和识别环境之间的失配,造成系统的识别性能在噪声环境下急剧地下降。因此低信噪比下的语音识别是目前国内外一个重要的研究课题,也是目前语音识别的研究热点和难点,具有极其重要的理论和实际意义。
本文从噪声模型入手,分析了噪声对语音识别系统的影响,并针对噪声模型的特点,分别从信号空间、特征空间和模型空间三个不同的方面,对当前语音识别研究领域中各种流行的抗噪声技术进行了介绍。在此基础上,本文提出了一种基于投票表决法的抗噪声语音识别算法,该算法借鉴了Missing Data方法的思想。Missing Data方法通过检测并丢弃语音特征中被噪声污染了的不可靠分量,只利用可靠分量进行识别来改善系统的抗噪性能。与Missing Data方法不同,投票表决方法并不对受损分量进行检测,因此不需要对环境噪声进行估计和假设,它采用了子带特征作为语音特征,在识别阶段对特征进行分组识别,然后对结果进行投票判决,从而降低局部受损分量对整体识别结果的影响,提高系统对局部噪声的抗噪能力。
为了验证投票表决法的可行性,本文利用:Matlab搭建了一个基于MFCC倒谱特征和HMM语音模型的语音识别实验平台,进行了大量的实验仿真,测试了该方法在不同窄带噪声环境下的识别性能,并和其它传统识别方法进行了比较。实验表明,投票表决法能够有效地提高系统在低信噪比窄带噪声环境下的识别性能,具有较强的抗噪鲁棒性。