语音识别中区分性训练算法研究

来源 :北京邮电大学 | 被引量 : 10次 | 上传用户：z360052113

【摘要】

：

声学模型训练作为语音识别中的一个重要组成部分,一直以来都是研究者关注的重点。传统的训练算法,例如最大似然估计(MLE)准则,由于在训练时没有考虑到模型之间的相互影响,因

【作者】

：

吴娅辉

【出处】

：

北京邮电大学

【发表日期】

：

2009年01期

【关键词】

：

连续语音识别区分性训练最小音素错误最大似然估计动态混合分量分解

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

声学模型训练作为语音识别中的一个重要组成部分,一直以来都是研究者关注的重点。传统的训练算法,例如最大似然估计(MLE)准则,由于在训练时没有考虑到模型之间的相互影响,因此性能往往不甚理想。与之相对应,区分性训练算法充分考虑了各个类之间的边界信息,因此性能相对较好。本文将基于大词汇量连续语音识别平台,围绕声学模型区分性训练技术展开研究,具体工作和创新主要包括以下几个方面：1.对声学模型训练算法进行了深入研究本文主要研究了基于生成性准则的最大似然估计训练算法和基于区分性准则的最大互信息估计(MMIE)训练算法以及最小音素错误(MPE)训练算法,并着重针对最小音素错误训练算法展开了相关的研究,并利用HTK工具搭建了各训练算法的实现平台。2.提出一种提高生成模型区分性的训练算法最大似然估计准则实现比较简单,可以借助经典的EM算法,但是由于没有考虑到不同模型之间的相互影响,因此生成的模型往往并不是最优的。本文提出一种简单的模型加权算法来提高生成模型的区分性,通过比较两组模型的类间方差和类内方差的大小来确定模型加权的权值。具体来说,针对语音识别,我们认为每一个识别基元对应一个类,不同的识别单元可以看作为不同的类,并且每一类都对应着自己的模型,即各自的HMM模型。在每个模型同一级状态上进行模型类内方差和类间方差的比较,模型的类间方差越大,类内方差越小,区分性就越好,在模型加权组合中所占的权重就越大。实验表明,该算法可以显著提高生成模型的识别性能。3.提出基于模型组合的区分性训练的改进算法生成性模型侧重于模型内部的描述,而区分性模型侧重于模型边界的描述。总体上讲,区分性模型的识别性能优于生成性模型,但是对具体模型来说这个结论并不一定成立,在实际中二者各有优势,如果将二者结合可望得到更好的效果。本文提出了几种将生成模型与区分性模型进行组合的算法。与前面提到的生成模型上的加权算法有所不同,由于区分性模型本身的分辨性能已经比较好,如果从整个空间计算模型间的参数值可能无法代表模型实际的混淆程度。因此我们首先提出一种混淆集的概念,得到每个模型最容易被混淆的集合,然后在各自的混淆集上计算模型的混淆参数,使得模型对应的权重计算更加有效。最后在混淆集的基础上提出两种模型组合算法,并应用于生成模型与区分性模型的组合以及区分性模型与区分性模型的组合。此外本文还提出了一种基于模型混淆程度进行模型加权的算法,同时将该算法扩展到多混合分量的情况。实验表明,这些算法可以得到比较好的性能。4.提出模型动态混合分量分解算法语音识别中,声学模型的每一个状态都是一个高斯混合模型,一般认为,只要合理的选择模型高斯混合分量的数目和分布,就可以任意逼近实际的分布。但是高斯分量数目的设计是一个比较繁琐的问题,为了提高模型的描述能力,需要较多的高斯分量,但较多的高斯分量会导致对训练语料的大量需求。因此在实际中高斯分量的数目必须折中选择。本文在MPE区分性训练算法基础上提出一种模型动态混合分量分解的算法。本算法的依据寻找可以提高整个模型空间上区分性能力的模型进行混合分量分解。根据这样的思想,提出了几种不同的模型分解准则,主要利用模型训练过程中的区分性统计信息并结合音素识别正确率进行模型的描述。实现时在MPE训练中生成的Lattice上计算音素正确率和音素混淆情况对应的统计量,利用这些统计量反映模型的描述能力,进行模型混合分量的分解,从而增加模型的区分性能力。该算法不需要引入额外的计算量,在MPE的训练过程中可以直接实现。实验表明,该算法可以在较少的混合分量的条件下得到与模型混合分量全分解相同或者更好的性能。

其他文献

用磷钼蓝法测定有机磷光催化降解效率

讨论了敌敌畏光催化降解后显色时间与其浓度的关系。用磷钼蓝法测定了敌敌畏浓度相同而钼酸铵浓度不同对显色时间及吸光度的影响 .还测定了当钼酸铵过量时 ,其吸光度的变化趋

期刊

光催化降解吸光度磷钼蓝法钼酸铵

云南省高等教育梯度发展现状及其意义研究

由于教育资源的有限,地区经济发展水平的不同,高等教育不可能实现各地区均衡发展,水平的提升不可能一步到位,而只能结合教育梯度结构现状,选择性的优先发展有条件有优势的高

期刊

高等教育教育层次梯度推进

物业企业人力资源开发中的薪酬设计与构想

<正>一、当前物业企业人力资源开发面临的问题改革开放三十多年来,我国房地产行业实现了突飞猛进的发展,与之配套的物业管理企业也迅猛发展,不仅推动人们生活质量的提升,也实

期刊

企业人力资源开发激励员工

2018-2030年中国电动汽车发展对于稀土需求的情景分析

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

会议

稀土元素电动汽车Bass模型中国

浅谈风电项目建设过程中如何加强安全管理

风电项目在建设过程中,因为受到地形、人员、设备、天气等多方面因素的影响,存在若干不可预知的风险因素,如何控制这些风险因素,将可能发生的风险点或危险源消除在萌芽状态,

期刊

风电项目施工方

高校大型仪器设备管理的思考

大型仪器设备在高校中担负着教学、科研、人才培养和社会服务的重要作用。充分发挥好大型仪器设备的使用率和投资效益,优化资源,合理搭建共享平台,是高校大型仪器设备管理中

期刊

大型仪器设备弊端措施

浅析小学数学教学中信息技术的应用

[摘要：伴随着现代信息技术的推行与发展，其早已广泛应用于教学当中，突显着日益重要的作用。对于小学数学教学来说，信息技术的有效应用不仅可以促进学生们的学习兴趣，更可以有效提高学习效率，使学习内容变得更为生动、形象、易于理解和掌握。本文就此对小学数学教学中的信息技术应用作了探讨与阐述。　　关键词：小学数学；信息技术；应用；方法]　　作为一种新兴的、先进的教学技术与手段，信息技术在我们的日常教学活动当

期刊

小学数学信息技术应用方法

膀胱镜直视下膀胱穿刺造瘘微创取石治疗膀胱结石57例

目的探讨膀胱镜直视下膀胱穿刺造瘘微创取石治疗膀胱结石的方法及体会。方法经尿道置入膀胱镜并连接影像系统，常规膀胱镜检见结石后，在膀胱镜直视引导下经耻骨上小切口膀胱穿刺

期刊

膀胱结石膀胱镜穿刺造瘘微创bladder calculi cystoscope cystostomy mini-invasion

《明经胡氏》的由来及其发展足迹

《明经胡氏》的由来及其发展足迹黄启昌１９１８年８月，蔡元培先生在为胡适写的《中国哲学史大纲》（卷上）作序时称，胡适生于世传汉学的绩溪胡氏，禀有汉学的遗传性。胡适对此没有否认。不料由

期刊

《中国哲学史大纲》《明经胡氏》胡开文胡次焱胡炳文云峰集黄启昌

南四湖的形成及水环境演变

采用重力活塞取样器在南四湖的独山湖和微山湖分别采取了两个湖底沉积剖面的样品.通过对湖底沉积物高分辨率的粒度、矿物、磁化率、有机碳、色素等环境指标和沉积年代学的综

期刊

南四湖湖泊沉积研究水环境演变黄河迁徙运河开挖

语音识别中区分性训练算法研究

其他学术论文