基于ＣＨＭＭ语音识别特征参数的选择方法

来源 :计算技术与自动化 | 被引量 : 0次 | 上传用户：Cgsking

【摘要】

：

【作者】

：

舒　倩　李银国

【出处】

：

计算技术与自动化

【发表日期】

：

2007年4期

【关键词】

：

参数特征分量系统协方差识别率

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘　要：基于CHMM的语音识别系统识别率高，但却占用系统资源较大，从而限制了其在资源受限的实际应用环境的有效实现。针对上述问题，给出特征参数选择的理论依据，弥补以往研究仅从实验结果分析，缺少理论依据的不足；同时提出根据各特征参数对系统误识率的影响程度来选择特征参数的新方法。该方法能使系统在训练，识别过程中的计算量和存储量明显减小，同时系统误识率不会显著改变。这为资源受限的语音识别系统，提供新的思路和有效的特征参数选择方法。
　　关键词：语音识别；CHMM模型；特征参数选择
　　中图分类号：TP391．4　文献标识码：A
　　
　　1　引言
　　
　　在语音识别的三大算法中CHMM算法的高识别率是以大计算量和大存储量为代价的，在基于嵌入式技术的语音识别系统或具有较强实时性要求的语音识别系统等特殊情况下，系统的资源和计算能力往往受到较大的限制，在保证一定识别率情况下减少识别算法对系统存储与计算资源的需求，具有重要意义。而语音识别系统的性能与系统所采用的特征参数密切相关，这就为我们利用特征参数的选取来实现系统识别性能与计算资源需求之间的折衷处理成为可能。目前，有很多文献做了各类特征参数对识别效果影响程度的研究工作，却没有讨论同一种类参数分量的问题；则通过对相邻分量的组合，用实验结果说明了MFCC分量的相对重要性，但他们都仅用实验结果加以说明，缺乏理论分析。
　　本文从CHMM模型的特点出发：一方面从理论上给出了选择特征参数的数学依据，另一方面提出根据特征参数对系统误识率的影响程度，选择特征参数的方法。
　　
　　2　基于CHMM模型特征参数选择的理论分析
　　
　　CHMM的Gauss概率密度函数的协方差矩阵本来应该是对称的满矩阵，为了降低对计算复杂度和存储量的要求，一般简化为对角矩阵。采用对角协方差阵使模型的参数减少，也有利于避免因训练样本不足而影响模型参数估计的可靠性。而且实验结果表明，概率密度函数的个数较多且取对角协方差阵的方案优于概率密度函数较少且取满元协方差阵的方案。所以，实际中一般使用具有对角协方差阵的Gauss概率密度函数。CHMM计算
　　

数下降N*M*T*R*K次；模板库中Gauss概率密度函数参数个数减少N*M*R*2*K个。
　　
　　4 实验及其结果分析
　　
　　实验数据：6个女性发音，0～9十个数字，每个数字发音50次，其中30次用于建立CHMM模型；实验模型选择：采用六个状态的从左到右的无跨越的4阶混合Gauss概率密度函数的CHMM模型，端点检测方法选择经典的双门限方法。
　　实验Ⅰ 在MFCC AMFCC中去掉某一分量找到对误识率影响较大的分量(见表1)。
　　实验Ⅱ 在MFCC AMFCC中去掉对误识率影响小的分量，找到最佳(见表2)。
　　从实验结果可以看出，在CHMM模型上采用MFCC₁、MFCC₂、MFCC₄、MFCC₅、MFCC₇、MFCC₈、MFCC₁₀、MFCC₁₁、△MFCCi(i≠11)组成19维的特征矢量，系统的误识率仅上升2.75％，即系统的识别率仍有95.75％，可以满足实际需要。而模板库参数个数下降2400个；同时在训练中N(U，σ²)的计算次数减少了41，834，880*K次(K为迭代次数)；匹配时N(u，σ²)的计算次数减少1200*T次(T为待识语音帧数)。实验结果表明：与常规的24维MFCC △MFCC相比，选择其中对识别率贡献大的主要分量构成的低维特征矢量，系统在训练、识别过程中N(u，σ²)的计算次数和模板库参数个数明显下降，而系统误识率仅略微上升。
　　
　　5 结论
　　
　　针对实际应用中资源有限的语音识别系统对识别率及计算量的特殊要求，本文根据基于对角协方差阵的CHMM模型的特点，给出了特征参数选择的理论依据，弥补了以往研究仅从实验结果分析，缺少理论依据的不足；同时提出根据各特征参数对系统误识率的影响程度来选择特征参数的新方法。通过保留对误识率影响大的分量，舍去对误识率影响小的分量，寻求次优低维参数组合。使系统在降低特征矢量维数减少计算量的同时，保证了系统误识率不会显著上升，系统的识别效果保持相对稳定。从而来满足语音识别系统对计算量、存储量等资源消耗指标和识别率的双重要求。
　　

　　此外，本文提出的基于CHMM的语音识别系统特征参数的选择方法，不仅适用于同一类参数分量组合与系统误识率的关系，而且适用于不同参数组合与系统误识率的关系分析。所以，在实际应用中，人们可以打破传统的取整体同一类参数的方法，根据对系统识别率与存储量、计算量的要求，合理选择的特征参数组合达以到目标。

其他文献

利用网络课堂提高思想政治理论课的实效性

摘要伴随着素质教育的不断施行，当前教育教學中对引导学生树立正确的价值观念，提高学生的道德素养非常看重，思想政治理论课程教学便随之成为了关注焦点。在现阶段的思想政治理论课程教学中，网络技术的渗透和应用取得了很好的实践效果，网络课堂更是成为了提高思想政治理论课程教学质量的重要途径和方式。本文将就利用网络课堂提高思想政治理论课的实效性进行深入的分析与探究。　　关键词思想政治理论课程教学网络课堂

期刊

政治理论网络思想教师学生高校

探究高校体育教学中融入德育教育的方法和途径

摘要众所周知，在教育教学领域中，德育教育本应该是至关重要的核心内容，但是在之前应试教育理念的影响下，在很长一段时间内德育教育都未能得到该有的地位和重视。近些年，伴随着新课程改革的不断深化和落实，德育教育逐渐开始受到重视，成为了当前贯穿于整个教育过程的重要内容。可纵观当前高校体育教学的实际情况，却很容易发现其在德育教育的渗透方面还是存在着一定的欠缺的，高校体育教学中的德育教学仍然处于比较薄弱的水

期刊

体育德育教育大学生高校自己的教学中

李亚威和她的“楚雄女儿”

2013年12月22日，在中央电视台音乐频道举办的2013年《寻找刘三姐》决赛“冠军之夜”上，从云南楚雄大山中走出的傈僳族选手玛嘉加朵，战胜了中央音乐学院众多在专业团体任独唱演员的选手获得冠军，成为“新时代的刘三姐”。　　玛嘉加朵17岁的时候被民进会员、著名女导演李亚威发现，从此走上歌者之旅。　　在“寻找刘三姐”的第一场比赛中，玛嘉加朵以一首原生态歌曲《金银鸟》震撼全场，评委认为这是“净化空气的声

期刊

楚雄彝族孩子云南火塘傈僳族

临近空间高超声速滑翔机动ＧＮＣ技术

摘　要：临近空间飞行器利用临近空间独特的环境特点，采用升力体构型，基于助推滑翔式弹道，实现高超声速滑翔和机动，极具发展潜力。介绍临近空间高超声速飞行器的发展历程，根据其飞行特点深入分析临近空间高超声速滑翔机动飞行所需的高精度GNC技术，并对其发展前景进行展望。　　关键词：临近空间；高超声速；滑翔机动；GNC　　中图分类号：V448．2　文献标识码：A　　　　1　引言　　　　临近空间是指距地面20～

期刊

飞行器声速空间弹道作战技术

多功能组合杆体经济效果浅析

摘要本文依托多功能组合杆体应用实例，并从改造前后使用杆体数量对比、使用钢材用量对比、使用基础混凝土用量对比等材料用量对比分析，阐述了在智慧城市建设中应用多功能组合杆体的优势;通过改造前后应用智能控制高光效LED路灯代替传统高压钠灯节能量对比分析、节省人力维护成本分析、其它应用场景拓展分析了多功能组合杆体作为广泛分布的基础设施的功能广度，与应用普通杆对比的技术经济效果。　　关键词多功能组合杆体

期刊

组合多功能用量基础收益钢材

论小学数学中多媒体技术的积极作用

摘要在小学数学中，教师可以利用多媒体技术带来的便利帮助进行教学，多媒体技术具有很多优势。多媒体技术可以实现动态演示，还可以进行情境代入，同时，多媒体技术还可以用来拓展课外知识，以及弥补教师不足，通过多媒体技术的帮助，教师可以实现传统课堂实现不了的效果，同时还可以帮助情境教学、信息化教学效果的实现，从而提高数学教学效率。　　关键词小学数学多媒体技术动态演示情境弥补　　在小学数学中，多媒

期刊

多媒体技术情境教师我就知识学生

浅谈如何提高小学语文教学低年级学生的阅读能力

摘要语文是小学低年级學生学习的重要基础课程，通过语文教学能够让学生了解和认识到更多的汉字和词语。而阅读是语文中重要的内容，能有效提升学生的思维能力，从而更够了解更多的知识。文章主要是对如何有效提升到小学语文数学低年级学生的阅读能力展开了研究和探讨。　　关键词提升低年级学生阅读能力　　阅读是学生能够学好语文的重要基础。小学阶段中的阅读重点是识字和认字，有效提升到学生的语言组织能力。当前学生

期刊

学生能力课文内容教师文章

绿色建筑施工管理在建筑施工管理中的应用

摘要近年来，我国经济建设发展迅飞猛进，革新传统的、落后的建筑施工管理是必然的趋势。建筑从最初的规划设计，到施工及运行，直至最終的拆除，整个过程都需要伴随着资源以及能源的损耗。面对建筑业这样严峻的形势，我们亟需在整个建筑施工的过程中提高环保以及节约的意识，加强管理，节约能源。本文就绿色建筑施工在建筑施工管理中的应用作相关分析。　　关键词绿色建筑施工;施工管理;节约能源;环保;应用　　1、国内绿色

期刊

建筑施工建筑施工管理过程中项目环境

浅谈台式电脑硬件故障分析与诊断维修

摘要伴随着我国的科技水平进步，同时人们的需求量也有所提升，在当今社会环境下，互联网的新兴发展是建立在电脑的基础之上，因此计算机成为人们生活中不可缺少的一部分，人们在日常生活中使用计算机可以获得极大的便利，同时计算机的应用也保证了社会科技进步和生活水平的提高。因此在进行电脑使用时，难免会产生一定的故障问题，导致计算机不能正常使用。本文通过对计算机的硬件故障进行有关分析，同时对其诊断维修进行了相关

期刊

计算机电脑现象主板故障显示器

浅谈低年级识字写字教学

摘要识字写字是阅读和写作的基础，是1～2年级的教学重点。识字与写字的要求应有所不同，1～2年级要多认少写。低年级段语文教学的重点是字词的教学。这就需要我们在识字写字的教学上多下功夫，让我们的学生学好汉字，喜欢汉字。喜欢语文。识字教学要将儿童熟识的语言因素作为主要材料，同时充分利用儿童的生活经验，注重教给识字方法;力求识用结合。　　关键词低年级识字教学小学语文　　1、采用多种方法，培养识字

期刊

学生生字汉字自己的方法再认

基于ＣＨＭＭ语音识别特征参数的选择方法

其他学术论文