论文部分内容阅读
非母语英文字母、汉语数字语音识别同属小词表的语音识别,对它们的研究具有重要的实用意义。尽管语音识别技术已经取得了很大进展,但由于英文字母自身存在严重的语音混淆现象,以及非母语语音的变异性太大等原因,目前的语音识别算法精确识别非母语英文字母仍然十分困难,识别效果达不到可实用水平。汉语数字识别,虽经过多年研究在PC平台和实验室条件下取得了高性能,但在具有广泛应用价值的嵌入式平台实现上,仍有许多工作需要做。本文首先探索性地研究了非母语英文孤立字母语音识别,然后针对实用需要对汉语孤立数字及数字连接串识别系统进行了研究,设计实现了基于嵌入式平台的汉语数字识别系统。
我们在讨论英文字母识别的主要技术和困难的基础上,实现了一个基本的英文字母识别系统,该系统采用了MFCC参数,使用了决策树方法建立上下文相关的基于音素单元的HMM声学模型及基于Viterbi帧同步算法进行识别搜索。我们还采集了一个非母语英文字母的语音库用于训练和测试。然后本文分析讨论了自适应方法对于非母语英文字母识别的作用,采用了简单快速的MLLR自适应方法,经实验取得了很好的效果。
本文还训练了音素级别上的高斯时长模型纳入段长信息,对识别率进行了提高。
本文还研究实现了高性能孤立汉语数字语音识别系统,并提出了一种目标范围限制下的孤立数字连接串的识别方式,这种方式一方面对模型空间和识别程序资源要求比较小,另一方面由于目标范围的限制提高了串识别结果的正确率,有利于在嵌入式平台上的实现及应用。在这里,采用了MCE区分训练模型,结合时长和音调特征等方法提高模型精度,系统性能达到实用效果。
最后,本文介绍了嵌入式DSP平台的特点,设计了基于DSP平台实现语音识别系统的框架结构,并通过在手机通信中应用的实例对应用前景做了展望。