论文部分内容阅读
语音识别系统的噪声鲁棒性是决定语音识别技术从实验室走向实际应用的关键环节,是目前语音识别领域的研究热点与难点。由于语音识别系统是一种基于训练的系统,实际应用环境与形成系统参数的训练环境噪声的失配是造成系统性能下降的主要因素。本文建立了一个基于CDHMM的汉语口令识别系统,以此为基础,从选择强噪声鲁棒性的语音特征参数,及对模型参数的补偿与修正等方面,对加性平稳背景噪声环境下的短语音汉语口令识别方法进行了研究。 本文的研究内容包括以下几方面: 1.建立了一个汉语口令短语音识别系统过程,在此过程中研究了HMM参数的训练问题。 2.分析讨论了训练状态数和混合度的最佳选取问题,通过大量实验得到了适合于汉语短语音(口令)的最佳状态数和混合度。 3.深入研究和分析了参数级的抗噪问题,通过实验分析比较了静态特征参数以及高阶动态参数之间的抗噪性能,得出了一般噪声环境下性能相对较好的特征参数形式。 4.在语音特征参数级去噪的基础上,提出了一种基于HMM和倒谱特征的噪声补偿方法,通过对纯净环境下的模型参数的补偿与修正,实现训练环境与测试环境的匹配。通过实验验证了该方法的可行性,并将模型级抗噪与参数级抗噪结合起来,实现了系统较好的噪声鲁棒性。