非特定人语音识别关键技术研究

被引量 : 0次 | 上传用户:maturevice
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别作为一个交叉学科,具有深远的研究价值和广泛的应用价值,是计算机技术研究和发展的一个重要领域。虽然目前语音识别技术已经取得一些成就,也有一些产品面世,但是大多数语音识别系统仍局限于实验室,在投入实际应用方面存在诸多限制。速度和精度是语音识别系统的关键,本文按照语音识别的流程,对语音识别关键技术进行了深入研究。首先,论文在介绍分析了语音信号产生的数字模型和语音信号预处理问题之后,针对传统端点检测算法的不足,提出了一种基于短时能零差分阈值的端点检测算法。语音端点检测直接影响语音识别率,是语音识别最基本而又最重要的环节。实验证明,新算法检测准确率提高了19%,且平均检测耗时节约了25.7%,优于传统算法。其次,论文对各类语音特征参数进行了讨论,并且在深入研究MFCC参数的基础上,提出了一种新的IMFCC参数。实验证明,新的特征参数对MFCC进行了特征加权、差分和PCA降维等一系列处理后,增强了语音识别系统的鲁棒性,在各种信噪比下的平均识别率提高了4.5%;节约了10.5%的系统训练时间,提高了识别系统性能。论文重点研究了基于HMM模型的语音识别技术。HMM模型应用于语音识别巨大的推动了语音识别技术的发展,它也是目前语音识别技术中最常用的建模技术。但是传统的HMM模型初始化方法过于简单粗糙,本文针对这点不足,提出了更符合语音实际的模型初始化算法。实验证明,新的初始化算法使得平均模型训练时间节约了24.7%,并且系统识别率提高了3.2%。论文在对语音识别理论研究的基础上,利用Matlab仿真软件建立了一个基于10人语音数据库的语音识别仿真系统。对汉语孤立字识别,本系统能较好满足基本需求,识别率达到92%。这为今后对语音识别技术的进一步研究奠定了基础。论文最后研究探讨了双模态语音识别的相关知识和理论。在复杂噪声环境下,光依靠语音特征已经无法提高识别率的情况下,为了能够得到更高的语音识别率,双模态语音识别技术是目前的研究热点,也是今后作者需要努力的方向。
其他文献
本文立足于郁达夫小说与传统文化的关系来对其小说作深入的考察,试图阐述传统文化对郁达夫之人格建构与审美情趣的影响,及其在作品中的具体显现,并藉此从中国传统文化的角度
日韩作为亚洲生物产业的先行者和领头羊,其生物科技产业相关政策的指导和调控卓有成效,各具特色。日本在生物技术和产业领域位居世界前列,政府通过优化发展战略、加大投入力
《红楼梦》是中国古典小说的顶峰,被誉为中国文化的百科全书。其中的诗词曲赋作为小说的有机组成部分,形式上具有“文备众体”,内容上“万象争辉”的特征,是小说中的“阆苑奇
劳资关系气氛(Industrial Relations Climate)作为劳资关系研究领域的前沿问题,是企业管理中的一个重要组成部分。随着我国社会主义市场经济体制的建立和完善,出现了许多新的
培训是企业人力资源管理工作的重要组成部分,做好销售人员的培训对销售型企业具有提升业绩的直接影响。本文对销售人员培训对企业的目的和意义以及如何设计一线销售人员培训
介绍迷你临床演练评估(Mini-CEX)的发展现状、在临床护理领域中的应用情况、应用中存在的问题,为Mini-CEX更好地在临床护理领域应用提供参考。
针对我国山区公路沿线岩质边坡崩塌评价问题,提出了公路崩塌地质灾害危险性分级系统(RFRS)。在对地形因子、公路因子、地质因子、气候因子、崩塌历史因子和防护措施加权乘子6
农村土地承包经营权、宅基地使用权和农房(以下简称"两权一房")抵押贷款的创新推出,对盘活农村金融,促进农村经济发展起到了积极的推动作用。然而就全国各试点地区情况反映,"
目的:了解上海市虹口区二级医院呼吸科抗菌药物的使用情况。方法:采用回顾性调查方法,按住院号排序等间距抽取2011年上海市虹口区5家二级医院呼吸科各96份出院病历,合计480份,
利用激光微细加工技术将根据仿生非光滑耐磨理论设计的仿生非光滑耐磨表面复制到55号钢模型试样上,在磨损试验机上进行影响凹坑形非光滑表面试样耐磨性多因素试验。采用试验