论文部分内容阅读
语音识别技术是计算机技术研究的一个重要领域,具有极大的研究价值和广泛的应用前景。但是现今的语音识别系统大多还局限于实验室,尽管已有一些产品进入市场,但是其使用效果距离人们期望的水平还有较大的差距。本文紧紧抓住语音识别系统中识别效率和识别率两个关键因素,按照语音识别的流程,对语音识别中的关键技术进行了深入研究。首先,论文在介绍了语音识别的基本原理和流程框架后,又分析了语音信号产生的数学模型以及语音信号的预处理问题,并针对传统端点检测算法的不足,提出了一种新的基于图像边缘检测技术的端点检测方法。实验结果表明,新的端点检测方法使检测准确率提高了18.6%,优于传统的检测方法。其次,论文介绍并讨论了几种常用的语音特征参数的特点和提取过程,在深入分析MFCC参数的基础上,对其进行了特征加权、差分、PCA降维等处理,获得了一种新的改进型的MFCC参数。实验证明,新的特征参数增强了语音识别系统的鲁棒性,在三种不同噪声环境下的平均识别率较传统的LPCC参数和MFCC参数分别提高了9.2%和4.3%,平均训练时间分别缩短了18.2%和11.5%。再次,本文重点研究了基于HMM的语音识别技术。正是由于HMM在语音识别中的应用,才推动了语音识别技术的飞跃式发展,同时HMM技术也是目前应用最为广泛的一种语音识别的建模技术。针对传统HMM模型的初始化方法过于简单和粗糙的缺点,本文提出了一种改进的HMM模型的初始化方法。实验结果表明,新的初始化方法使得HMM模型的平均训练时间缩短了36.9%,系统识别率提高了5.2%。最后,论文在对语音识别理论研究的基础上,结合语音识别算法的实现,利用MATLAB软件平台和自带的VoiceBox语音信号处理工具箱,建立了一个语音识别的仿真实验平台,并在此平台上进行仿真实验,实验结果表明,该系统对孤立词的识别率达到了95.5%。