基于CHMM语音识别特征参数的选择方法

来源 :计算技术与自动化 | 被引量 : 0次 | 上传用户:Cgsking
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:基于CHMM的语音识别系统识别率高,但却占用系统资源较大,从而限制了其在资源受限的实际应用环境的有效实现。针对上述问题,给出特征参数选择的理论依据,弥补以往研究仅从实验结果分析,缺少理论依据的不足;同时提出根据各特征参数对系统误识率的影响程度来选择特征参数的新方法。该方法能使系统在训练,识别过程中的计算量和存储量明显减小,同时系统误识率不会显著改变。这为资源受限的语音识别系统,提供新的思路和有效的特征参数选择方法。
  关键词:语音识别;CHMM模型;特征参数选择
  中图分类号:TP391.4 文献标识码:A
  
  1 引言
  
  在语音识别的三大算法中CHMM算法的高识别率是以大计算量和大存储量为代价的,在基于嵌入式技术的语音识别系统或具有较强实时性要求的语音识别系统等特殊情况下,系统的资源和计算能力往往受到较大的限制,在保证一定识别率情况下减少识别算法对系统存储与计算资源的需求,具有重要意义。而语音识别系统的性能与系统所采用的特征参数密切相关,这就为我们利用特征参数的选取来实现系统识别性能与计算资源需求之间的折衷处理成为可能。目前,有很多文献做了各类特征参数对识别效果影响程度的研究工作,却没有讨论同一种类参数分量的问题;则通过对相邻分量的组合,用实验结果说明了MFCC分量的相对重要性,但他们都仅用实验结果加以说明,缺乏理论分析。
  本文从CHMM模型的特点出发:一方面从理论上给出了选择特征参数的数学依据,另一方面提出根据特征参数对系统误识率的影响程度,选择特征参数的方法。
  
  2 基于CHMM模型特征参数选择的理论分析
  
  CHMM的Gauss概率密度函数的协方差矩阵本来应该是对称的满矩阵,为了降低对计算复杂度和存储量的要求,一般简化为对角矩阵。采用对角协方差阵使模型的参数减少,也有利于避免因训练样本不足而影响模型参数估计的可靠性。而且实验结果表明,概率密度函数的个数较多且取对角协方差阵的方案优于概率密度函数较少且取满元协方差阵的方案。所以,实际中一般使用具有对角协方差阵的Gauss概率密度函数。CHMM计算
  数下降N*M*T*R*K次;模板库中Gauss概率密度函数参数个数减少N*M*R*2*K个。
  
  4 实验及其结果分析
  
  实验数据:6个女性发音,0~9十个数字,每个数字发音50次,其中30次用于建立CHMM模型;实验模型选择:采用六个状态的从左到右的无跨越的4阶混合Gauss概率密度函数的CHMM模型,端点检测方法选择经典的双门限方法。
  实验Ⅰ 在MFCC AMFCC中去掉某一分量找到对误识率影响较大的分量(见表1)。
  实验Ⅱ 在MFCC AMFCC中去掉对误识率影响小的分量,找到最佳(见表2)。
  从实验结果可以看出,在CHMM模型上采用MFCC1、MFCC2、MFCC4、MFCC5、MFCC7、MFCC8、MFCC10、MFCC11、△MFCCi(i≠11)组成19维的特征矢量,系统的误识率仅上升2.75%,即系统的识别率仍有95.75%,可以满足实际需要。而模板库参数个数下降2400个;同时在训练中N(U,σ2)的计算次数减少了41,834,880*K次(K为迭代次数);匹配时N(u,σ2)的计算次数减少1200*T次(T为待识语音帧数)。实验结果表明:与常规的24维MFCC △MFCC相比,选择其中对识别率贡献大的主要分量构成的低维特征矢量,系统在训练、识别过程中N(u,σ2)的计算次数和模板库参数个数明显下降,而系统误识率仅略微上升。
  
  5 结论
  
  针对实际应用中资源有限的语音识别系统对识别率及计算量的特殊要求,本文根据基于对角协方差阵的CHMM模型的特点,给出了特征参数选择的理论依据,弥补了以往研究仅从实验结果分析,缺少理论依据的不足;同时提出根据各特征参数对系统误识率的影响程度来选择特征参数的新方法。通过保留对误识率影响大的分量,舍去对误识率影响小的分量,寻求次优低维参数组合。使系统在降低特征矢量维数减少计算量的同时,保证了系统误识率不会显著上升,系统的识别效果保持相对稳定。从而来满足语音识别系统对计算量、存储量等资源消耗指标和识别率的双重要求。
  
  此外,本文提出的基于CHMM的语音识别系统特征参数的选择方法,不仅适用于同一类参数分量组合与系统误识率的关系,而且适用于不同参数组合与系统误识率的关系分析。所以,在实际应用中,人们可以打破传统的取整体同一类参数的方法,根据对系统识别率与存储量、计算量的要求,合理选择的特征参数组合达以到目标。
其他文献
摘 要 伴随着素质教育的不断施行,当前教育教學中对引导学生树立正确的价值观念,提高学生的道德素养非常看重,思想政治理论课程教学便随之成为了关注焦点。在现阶段的思想政治理论课程教学中,网络技术的渗透和应用取得了很好的实践效果,网络课堂更是成为了提高思想政治理论课程教学质量的重要途径和方式。本文将就利用网络课堂提高思想政治理论课的实效性进行深入的分析与探究。  关键词 思想政治理论 课程教学 网络课堂
摘 要 众所周知,在教育教学领域中,德育教育本应该是至关重要的核心内容,但是在之前应试教育理念的影响下,在很长一段时间内德育教育都未能得到该有的地位和重视。近些年,伴随着新课程改革的不断深化和落实,德育教育逐渐开始受到重视,成为了当前贯穿于整个教育过程的重要内容。可纵观当前高校体育教学的实际情况,却很容易发现其在德育教育的渗透方面还是存在着一定的欠缺的,高校体育教学中的德育教学仍然处于比较薄弱的水
2013年12月22日,在中央电视台音乐频道举办的2013年《寻找刘三姐》决赛“冠军之夜”上,从云南楚雄大山中走出的傈僳族选手玛嘉加朵,战胜了中央音乐学院众多在专业团体任独唱演员的选手获得冠军,成为“新时代的刘三姐”。  玛嘉加朵17岁的时候被民进会员、著名女导演李亚威发现,从此走上歌者之旅。  在“寻找刘三姐”的第一场比赛中,玛嘉加朵以一首原生态歌曲《金银鸟》震撼全场,评委认为这是“净化空气的声
摘 要:临近空间飞行器利用临近空间独特的环境特点,采用升力体构型,基于助推滑翔式弹道,实现高超声速滑翔和机动,极具发展潜力。介绍临近空间高超声速飞行器的发展历程,根据其飞行特点深入分析临近空间高超声速滑翔机动飞行所需的高精度GNC技术,并对其发展前景进行展望。  关键词:临近空间;高超声速;滑翔机动;GNC  中图分类号:V448.2 文献标识码:A    1 引言    临近空间是指距地面20~
摘 要 本文依托多功能组合杆体应用实例,并从改造前后使用杆体数量对比、使用钢材用量对比、使用基础混凝土用量对比等材料用量对比分析,阐述了在智慧城市建设中应用多功能组合杆体的优势;通过改造前后应用智能控制高光效LED路灯代替传统高压钠灯节能量对比分析、节省人力维护成本分析、其它应用场景拓展分析了多功能组合杆体作为广泛分布的基础设施的功能广度,与应用普通杆对比的技术经济效果。  关键词 多功能组合杆体
摘 要 在小学数学中,教师可以利用多媒体技术带来的便利帮助进行教学,多媒体技术具有很多优势。多媒体技术可以实现动态演示,还可以进行情境代入,同时,多媒体技术还可以用来拓展课外知识,以及弥补教师不足,通过多媒体技术的帮助,教师可以实现传统课堂实现不了的效果,同时还可以帮助情境教学、信息化教学效果的实现,从而提高数学教学效率。  关键词 小学数学 多媒体技术 动态演示 情境 弥补  在小学数学中,多媒
摘 要 语文是小学低年级學生学习的重要基础课程,通过语文教学能够让学生了解和认识到更多的汉字和词语。而阅读是语文中重要的内容,能有效提升学生的思维能力,从而更够了解更多的知识。文章主要是对如何有效提升到小学语文数学低年级学生的阅读能力展开了研究和探讨。  关键词 提升 低年级学生 阅读能力  阅读是学生能够学好语文的重要基础。小学阶段中的阅读重点是识字和认字,有效提升到学生的语言组织能力。当前学生
摘要 近年来,我国经济建设发展迅飞猛进,革新传统的、落后的建筑施工管理是必然的趋势。建筑从最初的规划设计,到施工及运行,直至最終的拆除,整个过程都需要伴随着资源以及能源的损耗。面对建筑业这样严峻的形势,我们亟需在整个建筑施工的过程中提高环保以及节约的意识,加强管理,节约能源。本文就绿色建筑施工在建筑施工管理中的应用作相关分析。  关键词 绿色建筑施工;施工管理;节约能源;环保;应用  1、国内绿色
摘 要 伴随着我国的科技水平进步,同时人们的需求量也有所提升,在当今社会环境下,互联网的新兴发展是建立在电脑的基础之上,因此计算机成为人们生活中不可缺少的一部分,人们在日常生活中使用计算机可以获得极大的便利,同时计算机的应用也保证了社会科技进步和生活水平的提高。因此在进行电脑使用时,难免会产生一定的故障问题,导致计算机不能正常使用。本文通过对计算机的硬件故障进行有关分析,同时对其诊断维修进行了相关
摘 要 识字写字是阅读和写作的基础,是1~2年级的教学重点。识字与写字的要求应有所不同,1~2年级要多认少写。低年级段语文教学的重点是字词的教学。这就需要我们在识字写字的教学上多下功夫,让我们的学生学好汉字,喜欢汉字。喜欢语文。识字教学要将儿童熟识的语言因素作为主要材料,同时充分利用儿童的生活经验,注重教给识字方法;力求识用结合。  关键词 低年级 识字教学 小学语文  1、采用多种方法,培养识字