论文部分内容阅读
作为人机交互的接口技术——语音识别技术已经成为高科技应用领域的研究热点。传统的声学模型训练基于最大似然准则,它只是使用每个类内部的训练样本来进行该类的模型训练,而区分性训练能够调整不同的模型之间的分类面增强模型的描述能力,因此区分性训练的研究是一个十分有意义的课题。本文主要研究了最小音素错误准则,从目标函数最优化的求解算法(EM算法)到模型参数的更新算法(Baum-Welch算法)以及其它相关技术进行了介绍。相关的一系列实验都表明了相对于最大似然估计准则,它具有明显的优势。优化区分性训练主要有两个研究方向:一个是定义目标函数,即提出新的训练准则优化某些指标;一个是优化模型训练的算法,即优化根据目标函数得到最优的模型参数的过程。具体研究内容包括如下两点:1、优化传统的最小音素错误目标函数。对已有的一种基于置信度的最小音素错误训练方法进行了介绍,指出置信度和最小音素错误训练结合的研究方向是有意义的。于是针对传统的最小音素错误训练准则使用的风险函数中忽略删除错误的缺陷,采用基于置信度的F-measure函数对该风险函数进行了优化。相关实验表明了该方法是可行的,并且能够使模型性能有一定的提升。2、最小音素错误特征训练的研究。从优化模型训练算法的角度,对最小音素错误训练指导特征提取(fMPE)以及参数更新进行了研究。它的研究目的在于调整特征,使得目标函数值得到最优。通过对算法的实现,表明了该算法能够提升了识别率。