声学模型区分性训练及其在自动语音识别中的应用

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:color5188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
声学模型区分性训练已经成为当今主流语音识别系统中最重要的模型训练手段之一。与此同时,对区分性训练准则、模型优化算法以及应用性方法的研究,也日益引起越来越多研究者的重视。在这一背景下,本文围绕声学模型区分性训练及其在自动语音识别中的应用,进行了较系统而深入的研究。并且在准则、优化与应用三个方面都有一定的创新。首先,本文提出了一种新的区分性训练准则,即最小词分类错误MWCE准则。通过将传统基于句子级的MCE损失代价函数细化到词一级,MWCE准则尝试估计并最小化一个更直接的词级分类错误度量。由于这一词级错误度量更能够匹配大词汇量连续语音识别的目标,即降低词错误率,因此也就能够取得比句子级训练准则更好的识别性能。与其它的一些次句级区分性训练准则(如MWE、MPE)相比,MWCE准则提供了对词级错误的一个全新角度的表达,并在我们的实验中取得了更优的识别性能。这显示从训练准则上继续寻找物理意义更为明确合理的目标来进行优化,仍具有重要的意义。其次,本文提出了一种新的区分性训练模型参数更新算法,即MMIE准则基于Trust Region的模型参数更新。通过在参数更新过程中引入Trust Region约束,我们使用一种在数学上更为合理、物理意义上更为明确的方式来避免传统EB方法中无界优化问题的一些局限。同时,由于在每次迭代优化中我们都可以得到辅助函数在约束条件下的全局最优解,因此对准则更新的效率也就更高。实验证明,MMIE准则基于Trust Region的模型参数更新在准则优化与识别性能提升两方面都超过了传统的EB模型参数更新方法。第三,本文提出了对软分类边缘估计SME的一些完善和改进方法。通过将区分性训练领域近年来的一些重要技术引入,我们首次实现了句子级SME估计在大词汇量连续语音识别中的成功应用。接着,我们进一步提出SME估计下的帧级区分性训练方法,通过定义合理的分割度量,在帧尺度上对包含重要区分性信息的训练样本进行筛选。我们在实验中对比了传统MCE准则、句子级SME估计,以及帧级SME估计的性能。结果表明,由于引入了Soft Margin的概念,两种SME估计都能够取得超越MCE准则的性能。而我们提出的帧级SME估计在引入抑制噪声样本的参数后可以取得最好的、明显超过传统MCE准则的识别性能。最后,本文提出了一种区分性训练的应用性方法,即基于MMIE准则的HMM模型拓扑结构优化方法。我们根据MMIE准则定义出指导模型结构优化的启发性度量,尝试在各个HMM状态间“交换”高斯核以实现各状态混合高斯成份数目的非均匀分配。此外,还对高斯核交换完成后的特定HMM状态进行时间尺度上的拓扑结构后处理。通过以上这些步骤,我们将模型结构的优化与模型区分性的提高更直接的联系了起来。因此,基于区分性准则的模型拓扑结构优化方法在实验中能够在性能上超过传统的、基于似然度的其它模型结构优化方法。
其他文献
锌是生物必需的微量元素之一。近年来随着对锌肥的大量研究,提出了施锌改善作物品质、促进作物生长和干物质积累、促进锌营养富集等观点,但对于锌元素在小麦氮素代谢循环中发
研究了广式香肠在加工和贮藏过程中酸价、过氧化值、菌落总数的变化规律,进行添加物试验,以正交法优选出最佳方案:PC为0.01%,20A为0.06%,PHB为0.01%,EHB为0.01%,在35℃下采用
中央政府推动供给侧结构性改革,试图通过市场化导向逐渐缓解供给约束。当前我国农业产业化经营组织创新方兴未艾,符合现代农业发展方向。相对于农户家庭经营的局限性,农业产
在自然界中,有许多现象人们已经感知了,但不一定完全掌握其规律,有的已经掌握了的规律也不一定完全自觉地运用好,“黄金分割”定律就是这样一种让许多人痴迷,而又有许多人不
为更好地揭示东海大桥非通航孔所面临的船舶碰撞风险,采用空间有限元分析和截面能力计算对非通航孔桥墩的防碰撞能力进行计算,结果显示:东海大桥非通航孔桥墩只能抵抗小于500
现在国家不断的提倡人们对中国传统文化的认同,动画也是其中一个重要的传播方式。本文通过短片《入梦》创作,讲述我个人理解的中国传统文化。短片结合个人感受以及中国哲学思想下的世界观,以意识流、道家对于真理的意会非言传的方式表现出来。本文针对于短片《入梦》创作,从前期题材的选择、内涵主题的确立、以及美术设计的创作历程进行分析,将短片创作中所遇到的问题、对于哲学的理解、对世界观和自我意识的解读和绘画风格的构
当今中学生思想道德状况令人担忧,学校教育是德育教育的主渠道,作为从事思想政治教育的我们更应当主动承担这一重任,在课堂教学中走一步,再走一步。通过政治课堂教学的策略选
服务是物业管理的核心部分,是房地产作为一项商品在售后对客户的售后服务,包含管理的层面,也包含服务的层面,而关键在于有效的经营过程和服务意识。本文从物业管理服务意识的
叶果洛夫提出的沉降计算方法能够近似考虑深基坑的回弹再压缩变形、基础刚度、超补偿等分层总和法无法考虑的问题 ,本文归纳总结了它的基本特点、参数的确定以及在应用中的几
在马克思的国家与市民社会关系理论当中,他深刻地分析了国家的一些职能,社会职能是其中之一。这是研究其管理思想的依据。在对资本主义社会管理的深刻揭露和批判的过程中,他