基于WD/HMM的语音识别算法研究

被引量 : 0次 | 上传用户:suwenyin52
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术是信息技术领域的重要发展方向之一,目前其面临的一个重要挑战就是如何提高噪声环境下的语音识别率。特征提取作为语音识别的第一步,其性能对整个系统性能——语音识别率——具有至关重要的影响。因此,本文以提高系统在噪声环境下的语音识别率为目标,以提取抗噪声的语音特征参数为研究重点,研究了噪声环境下具有鲁棒性的语音识别系统。本文在深入理解语音识别基本原理的基础上,首先,介绍了几种被广泛应用的语音特征参数提取方法。其次,详细探讨了非平稳随机信号的时频分析方法——维格纳分布,从语音信号的时变特性出发,充分利用维格纳分布的优秀特性,把其应用于语音特征提取中,并与语音信号的同态处理方法相结合,提取出两组新的特征参数,即基于维格纳分布的语音倒谱参数WD-MFCC和基于对称相关函数的语音倒谱参数WV-MFCC。同时还得到基于维格纳分布的语谱图。最后,深入研究了隐马尔可夫模型在语音识别中的应用,把本文提出的两组语音特征参数和先前介绍的几种特征参数分别应用于以该模型为识别分类器的语音识别系统中,仿真并分析了噪声环境下利用各种语音特征时该语音识别系统的识别性能。仿真实验结果表明,采用本文提出的两组新的特征参数可以有效地提高系统性能。
其他文献
<正> (一) 重读《威尼斯商人》,总要想起英国著名的莎士比亚研究专家柯尔律治的一段话:"莎士比亚的人物,像实际生活中的人一样,常常被误解,几乎总是被不同的人从不同的角度来
能量流动是流域生态系统功能的重要体现。本研究以安塞纸坊沟流域为研究对象,利用流域1980~2001年的土地利用及社会经济动态数据,结合野外试验和调查,对纸坊沟流域生态恢复措施20
复合地基工后沉降是复合地基设计必需考虑的重要内容之一,对其如何合理地进行计算已逐渐成为工程界所关注的问题,但有关研究至今尚不多见。本文从解析计算和有限元分析两方面着
<正> 墨子名翟。他和他的弟子所著的书名字也叫"墨子"。"公输"是墨子中的一篇,选在高中语文课本第四册里。墨子的时代比孔子稍后,正当春秋以后和战国的初期。当时大国并吞小
期刊
冷战期间,美国政府以古巴与苏联之间有着紧密的政治、经济和军事联系而对美国国家安全构成威胁为由,对古巴采取敌视政策。冷战结束、苏联解体后,俄罗斯停止了对古巴的军事和经济
进入21世纪后,人类社会发生了巨大变化,开始由工业经济时代向知识经济时代转变。经济全球化和全球竞争水平的提高,使得企业组织不得不充分利用它们的一切资源以确保其生存和发展
自1991年被发现以来,纳米碳管(CNTs)已迅速成为国际研究的热点。而单壁纳米碳管(SWNTs)作为碳管的极限形式,具有十分独特的结构特征,其性能优异,潜在应用领域也十分广泛。然而,单壁纳
枢纽型社会组织作为一种突破社会组织"双重管理体制"的实践探索,在部分地区逐渐兴起。从基层的治理实践看,枢纽型社会组织并未起到其应有的作用,面临着形式化和专业化的双重
MBO作为一种产权改革手段,自被引进我国,就被赋予了建立国有资本的退出机制、推动产业结构和企业结构调整、中小企业和民营企业明晰产权等特殊的使命。但中国现在所操作的MBO比
目的调查神经内科重症监护病房(NICU)感染患者的病原菌分布及耐药情况,以指导临床抗菌药物的应用,降低医院感染率。方法对2008年9月-2010年5月期间入住NICU的216例患者送检的