声学模型区分性训练及其在LVCSR系统的应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：THE_BOSS

【摘要】

：

声学模型区分性训练是近年来语音识别领域的研究热点之一,它已经成为当今主流的语音识别系统,尤其是大词汇量连续语音识别LVCSR系统中最重要的模型训练手段之一。本文主要针

【作者】

：

刘聪

【出处】

：

中国科学技术大学

【发表日期】

：

2010年期

【关键词】

：

区分性训练声学模型大词汇量连续语音识别受限线性搜索有界信仟区域置信度判决

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

声学模型区分性训练是近年来语音识别领域的研究热点之一,它已经成为当今主流的语音识别系统,尤其是大词汇量连续语音识别LVCSR系统中最重要的模型训练手段之一。本文主要针对声学模型区分性训练及其在LVCSR系统中的应用问题进行较深入的研究和讨论。另外,本文对语音识别系统的另一个重要模块——置信度判决也有所涉猎。首先,本文提出了一种新颖的、称为“受限线性搜索”CLS的优化算法,该算法用于语音识别区分性训练中的CDHMM模型参数更新。CLS方法可以用于区分性训练统一准则框架下各种区分性准则的模型更新,包括MMI、MCE、MWE/MPE等。在该方法中,HMM的区分性训练问题首先被定义为一个受限优化问题,并且直接使用模型间的KLD度量来定量的描述所定义的模型间限制。接着,基于简单的线性搜索思想,我们发现在将该模型限制转化为二次函数形式后,可以很容易获得模型更新参数的闭式解。CLS方法可以用于优化CDHMM模型中的各种参数,包括高斯均值、协方差矩阵、权重等。接着,本文对我们此前提出的称为“信任区域”(Trust Region)的区分性训练模型参数更新方法进行了进一步理论分析和扩展。Trust Region方法通过将MMI区分性训练问题转变为一个优化理论中可参考的标准问题,从而准确高效的求取待优化函数的全局最优点。在引入上述模型间限制的前提下,Trust Region方法可以对区分性训练中的辅助函数进行完美的优化。然而,在区分性训练中对辅助函数的最优化无法保证对原始目标函数的优化。因此我们通过对Trust Region问题的深入理论分析,提出构造一种称为“有界信任区域”(Bounded Trust Region)的新辅助函数。该辅助函数仍然是目标函数的有效估计,更重要的是,在满足模型间限制的前提下,该辅助函数是原始目标函数的下界。这个优良品质可以确保对该辅助函数的最优化也能够带来对目标函数的优化。另外,这里构造的新辅助函数仍然可以直接使用标准的Trust Region方法来解决,从而可以快速求取全局最优点。实验表明基于Bounded Trust Region的方法超越了传统的EBW算法和原始Trust Region方法。第三,本文还针对实际的LVCSR系统中存在的若干问题进行了探讨,包括处理海量训练语料时的计算能力问题和由此导致的效率瓶颈,以及区分性训练中普遍存在的推广性问题等。在此基础上,我们分别结合基于WFST解码器生成的具有优良品质的词图,和传统的基于HTK计算区分性训练相关统计量的工具,搭建了一套用于区分性训练的新流程。该流程相对于传统完全基于HTK流程的区分性训练,不仅在训练效率上得到了极大的优化,在识别性能上也有一定的提升。最后,本文在语音识别系统的重要模块之一——置信度判决CM方向进行了相关工作。我们首先基于语音识别系统的输出定义了所谓的“目标区域”和“非目标区域”,并分别针对不同的区域选择合适的置信度判决方法。我们尝试发掘“非目标区域”中的额外信息,以期对传统只基于“目标区域”进行CM计算的方法起到补充作用。实验结果表明,基于“非目标区域”的置信度对基于“目标区域”的置信度有很好的补充作用。接下来,我们又进一步利用贝叶斯信息准则对“非目标区域”中所吸收的语音边界进行定位,基于定位后的置信度取得了更多的性能提升。

其他文献

明朝灭亡前,皇亲国戚一毛不拔

1644年3月18日,李自成攻陷北京,崇祯自杀,大明覆亡。在最后的日子里,崇祯这个刚愎自用、极爱面子的皇帝,曾为挽救江山社稷做了最后的努力:他放下皇帝之尊,去哀求大臣和亲戚们

期刊

李自成魏藻德明朝灭亡

研发“群包”

企业的研发费用日益上升但成果却差强人意？对于这个问题，几年之前管理专家的建议也许是去中国、印度和东欧这些有着优质而廉价的研发人员的地方开办新的研发中心，或者将一部分研

期刊

研发费用管理专家研发中心研发人员替代方式企业外包东欧

把战略细化到组织的细胞

对于确定的战略目标，不同的管理者可能会有不同的解读。而落实到具体执行的过程之后，战略目标的损失就会更多。如何才能把战略目标细化到组织的每个细胞，发挥最大的效能？

期刊

目标细化细胞组织管理者损失才能

重估人民币汇率的国内影响远大于国际影响

亚行经济学家帕克女士(Cyn-Young Park)在其最近发表的文章《应对全球贸易不平衡与亚洲国家货币》中指出：重估人民币对全球贸易不平衡与美国贸易逆差所能产生的影响微乎其微，但

期刊

人民币汇率国际影响重估贸易不平衡国内经济学家贸易逆差亚洲国家中国经济全球女士帕克亚行货币应对

稳健回归方法在榨季糖份预报中的应用

本文采用稳健回归分析的M估计法,以线性回归分析中的回归系数作为迭代初值,选用ANDREWS的目标函数,建立南宁糖纸厂1966/1967～1988/1989榨季糖份含量的农业气象模式,较好地处理

期刊

稳健回归糖份预报榨季

南宁机场高后雷雨的MOS预报

<正> 雷雨是一种小概率、小尺度天气现象。而对于小概率、小尺度天气系统的预报来说,模式输出统计预报方法不失为一种有效的方法。本文试用MOS方法对南宁机场的高后雷雨(包括

期刊

雷暴MOS预报南宁机场

浅谈高中化学课堂偶发课题的处理技巧

摘要：在现今的教育行业中，主要的目的是对学生开展教育活动，以此来促进学生的成长并养成学生良好的学习习惯。但是，在实际课堂开展的过程中，难免会出现一些偶发课题，这样的状况发生之后，对课堂继续开展形成了阻碍，这样的状况严重的影响了教学任务的完成。基于偶发课题出现后对教学的不良影响，在此次的研究中，主要针对高中化学课堂上出现偶发课题的处理技巧进行分析和研究。　　关键词：高中化学课堂；偶发课题；处理技巧

期刊

高中化学课堂偶发课题处理技巧

万吨重载列车在神朔段长大下坡道循环制动优化

对万吨重载列车在神朔段长大下坡道的实际操作情况进行分析，利用纵向动力学仿真系统对司机的操作进行了优化处理．分析结果表明，通过改变列车开始制动时的速度、机车制动电流以及

期刊

万吨重载列车长大下坡道循环制动次数1 000t train long heavy clown grade ： the number of cycle b

大悬挑钢结构节点区域受力性能分析及现场实测

中广核大厦部分结构从10层开始悬挑，悬挑长度17m。钢骨混凝土主体结构与悬挑钢结构间的连接节点区域受力大，为掌握该类节点区域的受力性能，采用SAP2000程序建立三维有限元模型，进

期刊

钢结构悬挑结构节点有限元分析承载力

常见热杀菌方式对关中羊乳品质的影响

采用5种常用热杀菌方式处理关中羊乳,即低温长时巴氏杀菌(65℃/30 min)、高温短时巴氏杀菌(72℃/15 s)、超巴氏杀菌(95℃/5 min)、高温高压灭菌(121℃/20 min)和超高温瞬时灭

期刊

关中羊乳热杀菌品质聚丙烯酰胺凝胶电泳

声学模型区分性训练及其在LVCSR系统的应用

与本文相关的学术论文