论文部分内容阅读
语音是人机之间信息传递最简单、自然的方式,当工作条件恶劣、人手受限时,这种方式的便捷性将更加显著。语音识别经过近六十年的发展,到目前为止已经取得了不错的成绩,但目前语音识别技术的发展水平还远不能达到实际应用的要求。其中实际应用环境中的噪声问题是制约语音识别系统应用的一个主要因素。作为语音信号处理领域中比较困难的前沿课题,抗噪声语音识别是语音识别系统实用化进程中必须解决的关键问题。
1、本文首先在对语音识别系统构成研究的基础上,介绍了其原理、算法并分析了各类算法的适用范围和优缺点。接着,结合本课题最终实现目标--实现智能仪器仪表声控功能以及未来系统的扩展性,分别实现了三种基线系统:特定人VQ、特定人CHMM、非特定人VQ。
2、然后,根据MFCC分量对语音端点的敏感性,设计了一种基于MFCCO的新端点检测方法。一方面该方法利用了MFCC特征参数的抗噪性能,从而具有鲁棒性,另一方面该方法有着较高的检测精度。实验结果表明,基于该方法的语音识别系统不仅可以通过端点检测大大压缩数据量,而且提高了系统的识别率。
3、结合抗噪技术的三大研究方向:语音增强、抗噪模型补偿技术、抗噪特征参数提取技术,分别介绍了相应的经典方法和最新研究成果。并从抗噪特征参数提取技术角度,基于CMN RAS MFCC、DAS CMN抗噪特征参数提取原理和实现的基础上,提出了修正抗噪参数M-DAS-CMN。接着提出了基于人耳听觉Mel频率上的含噪语音信号模型,并在此模型基础上,提出了新特征参数Mel CMN。实验结果表明,新特征参数M_DAS_CMN和Mel_CMN对Volvo噪声具有更好的抗噪性。其中Mel_CMN的抗造性更显著,这也从侧面证明了Mel频率上的含噪语音信号模型的合理性。
4、最后,针对Volvo噪声环境下的语音识别系统的特点,修正了基于MFCCO端点检测法,并利用自适应算法和本文提出的抗噪特征M_DAS_CMN、Mel_CMN设计了两种新的系统。实验结果表明新系统更适用车载语音控制系统的要求。