论文部分内容阅读
语音识别作为一个交叉学科,具有极高的研究和应用价值。语音识别和语音合成技术已经成为现代计算机技术研究和发展的一个重要领域,也是现代技术发展的一个标志。虽然语音识别技术已经取得了一些成就,也有部分产品面世,但大多数语音识别系统受识别精度和系统复杂度的制约,仍局限于实验室,远没有达到实用化要求。中、小词汇量的孤立词语音识别系统是语音识别中的一个重要发展方向并具有广泛的应用。其中在聋儿语言功能康复训练中,是将受训者所发语音进行处理后,提取语音的特征,与标准发音进行比较,使受训者逐步纠正自己的发音,特征参量的提取、分析、识别和应用等算法与语种密切相关,本文属于一种汉语语言视觉辅助语音训练系统的算法研究。针对汉语语音面临的理论和技术问题,研究了汉语语音孤立词识别技术及其实现方法。论文首先分析了语音信号预处理问题。对端点检测算法进行了部分改进,提出了一种基于EVRC的端点检测方法。在背景噪声变化的环境下,该方法将语音映射到一个基于心理声学模型的语音矩阵中,通过跟踪噪声,得到的语音矩阵和参数能够适应不同的背景噪声环境。结合汉语语音的特点,使用本方法无需改变门限,即可准确的检测出语音的端点。其次研究了基于DTW的语音识别系统,提出了一种基于联合得分的实时孤立词语音识别系统。在识别阶段,通过内插向量得到两种改进的DTW算法,并且和基本的DTW联合起来对语音进行识别,把各自的结果联合起来得到最终的识别结果。实验表明,系统在低信噪比的环境下和实时运行的环境中,都可以获得比一般只应用DTW算法的识别系统更高的识别率。最后研究了基于HMM的语音识别系统。针对HMM在实际应用中的优化计算问题,包括初始模型选取,定标等进行了深入的分析与探讨。针对传统定标仍能溢出的问题,给出了无溢出的参数重估公式。研究了基于“矫正训练算法”的非特定人DHMM识别系统,并进一步把该算法推广到非特定人CHMM识别系统中。仿真结果显示识别率有一定的提高。