基于GMM的连接词语音识别及大词汇表系统的语言建模

来源 :苏州大学 | 被引量 : 0次 | 上传用户:a9249228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
连接词语音识别又称连续数字语音识别。由于其实现方便,所需存贮要求低,运行速度快,具有广泛的实用价值,其众多的应用,如电话语音拨号、家电遥控、工业控制等,都给人们带来极大的便利。连接词识别的研究又可以推动大词汇表语音识别的发展,所以多年来许多研究机构都致力于连接词语音识别的研究和算法改进。本文实现了一个基于Gaussian混合模型的连续数字语音识别器。它将隐Markov模型和Gaussian混合密度分布紧密联系,结合动态规划算法对时间序列和Markov状态链进行非线性时间对齐,并运用EM算法对Gaussian混合模型的参数进行重新估计,识别出来的结果与期望结果采用Levenshtein距离进行比较并得出其字误差率。利用该语音识别器对SieTill德语连续数字语料库进行训练和识别,可以达到很高的识别率。同时本文还就大词汇表语音识别系统的语言模型的构建以及评估问题进行深入探讨,详细介绍了线性平滑和Kneser-Ney平滑技术,并用最大似然估计的方法获得其平滑参数。对语言建模的实验采用的是剑桥大学HTK工具、斯坦福研究机构的SRILM工具以及德国RWTH大学的SPRINT工具,并通过对欧洲国会英语版的会议记录脚本的处理,比较多种工具的在语言建模上的差异。
其他文献
由于数字产品的复制和传播变得越来越经济和方便,软件安全和盗版的问题也日益变得突出。据统计,到2001年软件盗版业已经有大约16亿美元的产值,而且正在快速增长。现在,软件产
目的:探讨环磷酰胺联合疗法治疗激素疗效不充分皮肌炎的价值.方法:收集我院20例激素疗效不充分的皮肌炎患者,患者符合多发性肌炎/皮肌炎诊断标准(B/P标准).患者男性8例,女性9
目的:分析腰部夹脊穴加用温针灸治疗腰椎间盘突出症临床观察及对疼痛的治疗效果.方法:选择2014年1月-2016年12月在我院接受治疗的腰椎间盘突出症患者110例,随机分成对照组及
随着计算机和通信技术的迅猛发展,图像应用范围越来越广。人类对信息的需求已不局限于传统的语音、文字信息,而是集视频、图像、声音、文字于一体的高品质多媒体信息,但是它
期刊
超宽带技术被认为是无线通信领域中一种革命性的新技术,以其巨大的军事、商业价值和技术挑战引起了国际通信领域工业界和学术界极人的关注。超宽带通信成为中短距离高数据率无
低密度奇偶校验(Low Density Parity Check, LDPC)码性能逼近香农容限并具有较低的译码复杂度,为此受到越来越多的关注。在此基础上,美国喷气推进(Jet Propulsion Laboratory
随着数字媒体技术以及网络通信技术的快速逐步发展,某些用户利用互联网通过某些手段能够无偿的获取某些需要付费的数字内容服务,这侵害了这些提供内容服务提供商的权利。数字
目的:对针灸治疗头晕头痛的临床疗效进行分析和观察.方法:在我院2016年3月-2017年月期间收治的头晕头痛患者中选取90例作为研究对象,根据随机双盲原则对患者分组,给予观察组
期刊