隐马尔可夫模型在说话人识别中的应用与研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:whywxh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文是隐马尔可夫模型在说话人识别中的应用与研究,论文在概述了语音识别的发展和现状的基础上,介绍了说话人识别的声学原理,其中包括语音信号的生成过程及其分析方法,着重阐述了语音信号的倒谱分析方法和LPC倒谱参数。接着详尽介绍了HMM的基本原理以及HMM的三个基本问题——评估问题、训练问题和识别问题,及其相应的基本算法(即前—后向算法、Baum-Welch算法和Viterbi算法)。   在利用HMM进行说话人识别的研究过程中,发现前—后向算法中的αt(i)和βt(i)出现了下溢(underflow)问题,VQ算法分类阈值的不同、码本大小的不同以及初始模型的选取对系统训练模型的建立和识别率的高低都起着至关重要的作用。经过反复实验和详细比对,提出了相应的解决方法,并得出如下结论:(1)前后向算法中αt(i)和βt(i)的下溢,采取增加比例因子的方法可以对其修正;(2)模型λ=(π,A,B)中初值π和A的选取对系统影响不大,而B有较大影响,为了避免初始模型的选择不当,可以采用反复迭代直至收敛的方法,一般只需4~8次迭代即可达到预期效果;(3)VQ算法中分类阈值可以基于霍特林的“主分量分析”方法对LPC倒谱降维后选定。   根据实验过程中出现的问题,运用相应的改进方法对程序进行修正,最后给出了一个文本相关的小样本说话人识别系统,可以取得预期的识别效果。
其他文献
本文考虑了一类变量与控制不分离的常微分系统在缺乏Cesari条件下的最优控制问题。利用相应最优松弛控制的存在性和最大值原理证明了某些条件下原问题最优控制的存在性。然后
迁移理论是非平衡态统计力学在运动论层次上的数学表达。在光子迁移理论中,通常考虑以下三种类型的问题: 1.根据各种截面、入射光子流和星际云层的表面形状对光子密度作出
随着现代信息技术的发展,在日常的商业运作中积累大量关于时间序列的数据,这些数据中蕴含了大量的商业信息,需要我们进行挖掘.孤立点的挖掘是其重要的一个内容.在传统的观念中,孤
本文内容概述如下:第一,研究状态、控制输入均含有时变时滞,且互联项也含有时变时滞的不确定组合系统的状态反馈鲁棒分散控制问题.第二,研究结构复杂的时变时滞不确定组合系
本文主要利用主单边理想或者极大本质单边理想是拟理想,或者主左(右)理想是弱右(左)理想的条件,研究了一些特殊环(如GP-V-( GP-V5-),,弱正则环和广义正则环)的强正则性,得到
学位
本文在完备格上引入—个新的拓扑S-拓扑。进一步讨论了S-拓扑的一些性质以及S-拓扑与Scott拓扑和Lawson拓扑之间的联系和区别,在此基础上证明连续格L上的S-拓扑是—个单调的Ha
研究了一类非自伴算子即无穷维Hamilton算子的谱,首次构造出剩余谱为非空集的无穷维Hamilton算子,并给出无穷维Hamilton算子的剩余谱是空集的充分必要条件,而且得到关于无穷
本文涉及MengerPM-空间上的不动点理论.主要研究复合映射的不动点定理和弱相容自映射的公共不动点定理。主要内容包括以下个四方面: 1.利用引入的实函数类Aφ,在完备的Menge
在对生态学的研究中,考察生物种群的演化已经成为一个重要的课题。生物种群是极其复杂的,一方面我们考虑的是只有两个种群的捕食与被捕食系统,且种群在空间中的密度分布不均匀,种