基于最佳状态数的汉语数字语音识别系统的研究与实现

被引量 : 13次 | 上传用户:tdsl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来汉语数字语音识别系统越来越广泛的应用于各个领域。在实际生活中,由于噪声等因素的影响,常常造成汉语数字较低的识别率。本文对汉语数字语音识别系统的训练数据、评测数据及声学模型进行了研究。完成了对两个新语音库中评测讲话者的选择。并对系统识别精确度进行分析,通过对单音子模型及双音子模型的状态数的调整,提高了语音识别系统的识别精确度。本文主要研究了以下三方面的内容:1.研究了汉语语音识别系统中声学模型的构造。并了解语音识别系统中相关声学模型参数估计、识别过程的算法及步骤。这个过程有利于对语音库中训练数据和评测数据的区分,并为提高系统识别精确度提供了依据。2.提出了一种为语音库选择评测讲话者的方法。对于目前已拥有的几组不同的评测讲话者,通过分别比较各组评测讲话者识别精确度曲线与语音库所有讲话者识别精确度曲线之间的最小均方差值,选择出该值最小的一组评测讲话者,作为此语音库的评测讲话者,用于客观衡量语音识别系统中模型的训练好坏。3.在提高识别系统精确度的研究中,对数字1和数字5的识别错误率进行了分析并找出相应的问题,通过逐步调整单音子模型及双音子模型的状态数,进而对模型进行改进。最后,在实验中逐步修改数字1、数字5的单音子模型及双音子模型的状态数,对修改后的模型进行训练、参数重估,并对系统进行评测,得到新的识别精确度。结果表明,通过对模型状态数的修改,系统的识别精确度得到提高。
其他文献
<正>汉魏南北朝时期的文学主要是以《七发》为代表的歌赋体文学和以《史记》为代表的纪传体文学,成就非凡, 在散文和乐府民歌上也颇具成就。而汉赋《七发》中的“天下之至美
目的探讨基线血清高敏C反应蛋白(hsCRP)水平与颈动脉斑块检出率的关系。方法采用前瞻性队列研究的方法,随机分层抽取唐山开滦(集团)有限责任公司在职及离退休职工中年龄≥40
近年来,由于北京市流动人口和第三产业从业人数的增加使得社区不安全因素增多,北京城市社区的安全越来越引起了人们的重视。北京城市社区安全管理在取得成效的同时,也存在着
我刊本期和下一期将刊登两篇从方法学角度对于Meta分析进行评价的文章,一篇重点介绍其优点和价值,另一篇介绍其不足和限度。目的是向读者介绍Meta分析的知识和国际上关于Meta
我国城市台有过高歌猛进的发展,成绩辉煌,贡献巨大,但这已经属于过去。从当前面临的重重危机看,城市台正进入到一个新的重要发展期。在这个发展期,来自央视和卫视的挤压,来自
随着信息技术的不断发展,数字矿山建设已成为矿山信息化建设的重中之重,引起越来越多的矿山科技工作者的重视。虚拟矿山系统为数字矿山建设提供一个虚拟平台,对推动采矿企业
<正>价值观是人们心中的深层信念系统,核心价值体系能否与时俱进,直接影响到一个国家的凝聚力和影响力。加强社会主义核心价值体系建设,有利于全社会形成良好的思想道德规范,
本文在广泛查阅国内外文献的基础上,对DEA理论、方法与应用进行了较为深入的探讨,分析了基本DEA模型,DEA有效性理论以及DEA方法的基本思想。在多目标DEA的基础上,考虑到实际
课程中的性别问题一直是教育研究者所关注的热点问题,通过教育使所有女孩和妇女最充分地发挥自己的潜能,建立起有助于实现性别平等的社会文化环境,是现代教育的重要使命。起
<正>同志们:经学校党委专题会议研究,对新学年中层及有关管理岗位所需的人员进行了聘任。今天,我们召开会议公布聘任方案,并对有关工作进行安排,希望新应聘履职的中层干部和