论文部分内容阅读
语音识别技术近年来高速发展,有着广阔的应用前景。让机器听懂人说话,甚至实现与人的交流是人类一直以来梦寐以求的愿望。现在语音识别技术的研究工作主要集中在大词汇量连续语音识别的范畴,但是对汉语而言,在提高系统识别率和系统鲁棒性方面都有大量的工作要做,这仍然是个任重而道远的任务。本文首先介绍了在语音识别中广泛应用的隐马尔可夫模型的基本理论。同时为了将该模型引入到语音识别的实际应用,讨论了它的三个主要问题和主要算法。接着介绍了本文中普通话数字声学模型所使用的语料库和训练环境,分析了普通话数字的声学特点并研究了其训练方法。更详细分析了普通话数字的识别难点和声学模型缺陷。针对连续数字识别的难点从标注和模型自身两个方面提出相应的模型优化办法来对其改进。获得大量的实验数据后,对实验结果进行了总结和分析,肯定了模型训练优化方法的有效性。随后对汉语普通话的声学特点进行了详细介绍,分析了音素,音节,声韵母等不同基本单位作为识别基元的优劣,并对关键词识别系统进行了介绍,对于两种不同结构的关键词系统进行了比较分析。为了改善关键词系统的拒识性能,训练出关键词反词模型,并获得了竞争词似然度测试结果,对两者进行了比较和分析。最后对本篇论文所做的工作进行了总结和展望。