论文部分内容阅读
小词汇量非特定人孤立词语音识别是语音识别领域中的一个重要分支,在家电遥控、智能导航、人机交互等领域都有着广泛的应用价值。
近年来,语音识别技术得到了飞跃性的进展,但关于模型设计的细化、参数的提取和优化仍然是讨论的热点和难点。本文系统的研究了小词汇量孤立词语音识别系统的各项组成技术,并在此基础上提出了DHMM模型中的自适应矢量量化方法和小波零极值特征参数提取方法。
本论文主要完成了以下工作: 1、设计了一个包括语音文件、说话人地域、说话人性别等关于方向信息的语音数据库。
2、系统地讨论了小词汇量非特定人孤立词语音识别的几种常用算法,包括离散隐马尔可夫模型(DHMM),BP人工神经网络(BPANN)以及主成分分析(PCA),并详细阐述其原理及其系统实现过程,进行了识别性能的比较。
3、针对DHMM模型中所用的矢量量化方法,提出了一种自适应矢量量化方法,并将其与传统的LBG算法作了性能分析和比较。同时,在自适应矢量量化中,还应用了空包腔的优化处理方法。
4、结合小波具有良好的时频域特性,利用ARMA零极值模型参数化小波系数,得到语音信号的零极值特征,结合倒谱系数作为特征参数进行训练识别。通过实验,分析各阶特征参数的平均贡献率。
5、解决了系统实现过程中的下溢问题和多观察矢量序列问题。