基于隐马尔科夫模型的语音识别技术研究

被引量 : 0次 | 上传用户:kkk0089
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术。其根本目的是研究出一种具有听觉功能的机器,这种机器能直接接受人的语音,理解人的意图,并做出相应的反应。语音识别以语音信号为研究对象,是语音信号处理的一个重要研究方向,是模式识别的一个分支,涉及到语言学、计算机科学、信号处理以及生理学、心理学等诸多领域,甚至还涉及到人的体态语言,其最终目标是实现人与机器进行自然语言通信。语音识别具有广阔的应用前景,已经在听写机、电话查询系统、家电控制等诸多领域获得到了充分的应用。目前说话人识别领域主流的算法是基于隐马尔科夫模型(Hidden Markov Model)。隐马尔科夫模型用隐含状态对应声学各层相对稳定的发音单元,并通过状态的驻留,转移描述发音变化。为了研究方便,隐马尔科夫模型假设连续段长分布的时间是服从几何分布,但这与真实的分布规律并不相符。本课题试采用的基于段长分布的隐马尔科夫模型更准确的描述语音信号的时间相关性。本文以HTK(HMM toolkit)工具作为语音信号处理平台,建造一个简单的基于特定人的连续汉语语音识别系统。利用该系统分别对采用不同类型的特征参数的识别效果进行比较,通过实验方式找出最合适该汉语识别系统的模型参数设定。实验发现将汉语中的声母和韵母作为基本的声学单元来建立HMM模型,将声母韵母状态数分别设为3和5,输出观察值混合高斯维数为7时,识别的准确率可以达到较好的效果,继续增加状态数和高斯维数后,识别结果没有明显提高而且使识别速度变慢。实验最后通过修改HTK源代码实现基于段长分布的隐马尔科夫模型,结果表明,改进的隐马尔科夫模型在噪音环境下能获得更好的识别效果。
其他文献
起重机在船舶上有着广泛的应用,起重机作业时,不仅需要考虑起重机自身的载荷,同时还要考虑船舶的横倾、纵倾,海上风力的影响。因此支撑结构的受力较为复杂,为了结构安全,需要
Mn基磁控形状记忆合金是反铁磁性合金,具有多功能特性。与铁磁性材料相比,其功能性和实际应用还尚未被人们充分认识和开发。因此,研究该类材料的物理和力学性能具有重要的意
牙齿保护素──茶叶茶叶可以预防虫牙最近在日本糕点的包装上,经常出现这样的字样“不用担心你的牙齿”、“对牙齿无害”、“含有牙齿保护素”,并且这样的字样已经扩大至糖果、
1927年前,宋庆龄并没有在国民党的政策制定和中国政治生活中产生重大影响。她是孙中山的崇拜者和支持者。国民党二大她当选为中央执行委员会委员,但也还没有深入到国民党政治
目的探讨CAR-T细胞免疫疗法在临床研究中引发的伦理问题,为临床研究中涉及该技术的伦理审查要求提供参考。方法总结国内关于CAR-T细胞免疫疗法的发展现状及存在的伦理问题,提
本文论述了会计学的两大部类,即计量会计学和非计量会计学的概念、客观性、研究方法及学科体系,并在此基础上进一步阐述了计量会计学与非计量会计学之间的关系。
目的:观察腹腔镜手术辅以不同药物治疗卵巢子宫内膜异位症囊肿临床效果.方法:对我院2007年6月~2009年6月163例卵巢子宫内膜异位证囊肿患者术后辅以不同药物的治疗效果、副作用、
多轴数控技术主要应用于复杂曲面的高效、精密、自动化加工。其作为数控加工技术中难度最大、应用范围最广的一种技术,主要是集中计算机控制、高性能伺服驱动和精密加工技术于
亿贝成立于1995年,是全球最大的电子商务公司之一。2012年,亿贝的总商业交易总量达到了1750亿美元。亿贝旗下有三个主要的平台:第一是Paypal支付平台,消费者在上面可以进行电
对天津市某污水处理厂工程进行了设计,其规模10万m^3/d,出水执行天津市地方标准《城镇污水处理厂污染物排放标准》(DB12/599-2015)A类标准,项目污水处理主体工艺采用“改进型