论文部分内容阅读
本文是隐马尔可夫模型在说话人识别中的应用与研究,论文在概述了语音识别的发展和现状的基础上,介绍了说话人识别的声学原理,其中包括语音信号的生成过程及其分析方法,着重阐述了语音信号的倒谱分析方法和LPC倒谱参数。接着详尽介绍了HMM的基本原理以及HMM的三个基本问题——评估问题、训练问题和识别问题,及其相应的基本算法(即前—后向算法、Baum-Welch算法和Viterbi算法)。
在利用HMM进行说话人识别的研究过程中,发现前—后向算法中的αt(i)和βt(i)出现了下溢(underflow)问题,VQ算法分类阈值的不同、码本大小的不同以及初始模型的选取对系统训练模型的建立和识别率的高低都起着至关重要的作用。经过反复实验和详细比对,提出了相应的解决方法,并得出如下结论:(1)前后向算法中αt(i)和βt(i)的下溢,采取增加比例因子的方法可以对其修正;(2)模型λ=(π,A,B)中初值π和A的选取对系统影响不大,而B有较大影响,为了避免初始模型的选择不当,可以采用反复迭代直至收敛的方法,一般只需4~8次迭代即可达到预期效果;(3)VQ算法中分类阈值可以基于霍特林的“主分量分析”方法对LPC倒谱降维后选定。
根据实验过程中出现的问题,运用相应的改进方法对程序进行修正,最后给出了一个文本相关的小样本说话人识别系统,可以取得预期的识别效果。