论文部分内容阅读
语音识别就是让电脑听懂人的话,并做出正确反应。语音识别技术是计算机技术重要的发展方向,语音识别已经形成了完整的理论体系,基于PC平台的语音识别系统的研究也在技术上获得了一些成功,尽管目前语音识别的研究已经进入了商品化阶段,基础性理论相当完善,各种各样的产品也相继涌现,但在许多特定领域,由于其环境和行业的特殊性,往往需要专门进行开发,以适应实际需要。 本文首先介绍了语音识别技术的国内外发展状况,分析了语音识别系统商品化过程中面临的困难,在此基础上阐明了本课题的研究背景和意义。 其次,根据语音识别系统的基本构成模型,介绍了预处理、端点检测到模板生成及模板管理和模板匹配各部分所涉及到的语音数字信号处理、模式识别等方面的基本原理,并讨论了在PC机上实现语音识别系统的几种途径。 接着,本文介绍了使用Visual C++6.0根据DTW(动态时间弯折)模型的语音识别训练和识别的基本方法,在Windows操作系统上实现的一个简单的非特定人、小词汇量、孤立词语音识别系统(模拟航线查询系统的语音识别控制接口部分)。系统的组成模块与语音识别系统的基本构成模型基本一致,在训练过程中,通过调用MCI(MCI Multimedia Control Interface)提供的函数从语音库中的波形文件中读取采样数据,分帧计算出由12维线性预测系数和12维线性预测倒谱系数构成的特征矢量,并按照聚类的方法进行训练,得到后续语音识别时需要的模板,存放于模板库中。识别时,计算出输入语音的特征矢量参数,依据模板匹配的方法与模板库中的语音模板逐一进行比较,得出最佳的匹配模板,或作出拒识判断。在此基础上本文还针对特定的应用领域提出了系统的一些改进方案,如适应低信噪比环境的线性预测方法,改进的DTW算法,以及用人工神经元方法进行端点检测两级判别法的阀值确定。最后对系统性能进行了小结,指出了该系统的改进方向。 本文通过对实际语音识别系统的测试和研究,为进一步开发实用性语音识别系统的工作做了基础和探索性的工作。