基于WFST的中文语音识别解码器的研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:aaa860824
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术,主要是通过计算机语音处理技术,实现一种人机界面,为人与人和人与计算机之间的顺畅交流提供一种便捷的方式。自语音识别技术发展以来,已经取得了一定的研究成果,国内外诸多大公司也加大了对大词汇量中文语音识别技术的开发和研究。在语音识别技术中,解码器是最为关键的部分。近年来,有限状态转换器被广泛应用于语音识别技术中。由于有限状态转换器不仅可以使用于模拟讯号模型,更可以进一步模拟自然语言中许多重要且繁复的文法结构与文法特性。因此,有限状态转换器成为语音研究有力的工具。本文主要讨论带权有限状态转换器在大词汇量中文语音识别系统中的应用。它的基本思想是,将声学模型、发音词典、语言模型分别用一个加权有限状态转换器来表示。然后通过组合演算法将其整合为一个完整的加权有限状态转换器模型,从而可以得到一个同一维度的语音识别搜索空间。本论文可分为四个部分:第一个部分是带权有限状态机相关的基本概念和理论推导;第二部分讨论如何将传统语音识别中所使用的声学模型、发音词典和语音模型分别建立成有限状态转换器形式,以及介绍合并演算法,用来减少各有限状态转换器的状态数和转移数;第三部分讨论如何以组合算法将各带权有限状态转换器整合成为一个搜索空间,以及优化问题;第四部分,设计并实现解码器,在给出测试语料的基础上进行试验。最后,将实验结果与传统的基于HTK工具的识别结果,分别在识别率和解码速度两个方面进行比较,得出结论。证明基于加权有限状态转换器的识别系统的正确性及优越性。
其他文献
本文针对独立学院培养应用型人才的办学思路,从建设网络课程的基本要求、基本原则、基本内容以及使用等方面对网络课程在独立学院中的应用进行了探索。
目的 探讨SMAD4、CyclinD1、Survivin和Cox-2在大肠癌组织中的表达及意义.方法 运用免疫组化SP法检测SMAD4、CyclinD1、Survivin和Cox-2在44例大肠癌组织中的表达,并建立多因素COX比例风险模型分析患者的预后.结果 SMAD4、CyclinD1、Survivin和Cox-2表达与患者性别、年龄、大体类型和组织分级均无关(P>0.05);SMAD4、Su
为解决广东松类插条苗造林扦插扩繁的瓶颈,介绍了在广东湿加松、高脂马尾松松树采穗圃营建和管理技术,具体技术包括:培育健壮母苗、高标准定植、培育"矮桩(干)平台式"株型等
2006年6月7日,以“创新科技,超越未来”为主题的“2006英特尔中国研究论坛”在北京召开。来自国内一流高校的600多位博士和硕士研究生,与英特尔公司的多位院士和高级科学家,以及
临床急危重症的终末期大多都会出现呼吸窘迫甚至呼吸功能不全,故如何维持呼吸功能、改善通气、纠正缺氧、防止二氧化碳潴留,使机体有可能度过基础疾病所致的呼吸功能障碍已经成为抢救危重病人的一项重要措施.机械通气技术的出现适时地解决了这个问题.随着对疾病本身认识的不断深入,电子和机械技术水平的不断提高以及呼吸机的性能的日臻完善,使得机械通气应用的范围越来越广,现已经成为抢救危重病人的重要措施.目前由于呼吸机
<正>20世纪80年代以来,人们对企业财务报告与会计信息的批评越来越激烈。批评的焦点集中在企业财务报告没能跟上时代快速变革的步伐,未能提供决策有用的信息。我国会计界对寻
为了解北京高职学生学习需求,遴选北京市5所高职学院三年制普通高职2018级和2019级共800名学生进行抽样调查,采用SPSS软件进行数据统计分析,最终得出五个主要结论,提出两点改
本文通过对变量间直接换值方法的探讨,提出了n(n〉=2)个变量间不通过中间变量直接换值的一种算法,该算法思想简单、易懂、规律性强,代码编写简洁且不易出错。通过教学证明,学生能容
中小学(幼儿园)教师学历层次是衡量教师发展水平的重要指标之一,我国在经历了最初的学历补偿教育后,教师培养层次迈入新的发展阶段。本文根据2001—2018年教师学历的发展速度
青年世界观形成的哲学探讨(续二)《青年世界观形成的哲学探讨》课题组三、提高青年思想工作的科学性、针对性和有效性青年世界观教育是一个社会系统工程,要在党的统一领导下,有关