基于有限状态图的语音识别系统的构建

被引量 : 0次 | 上传用户:aidam
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经过Mohri等学者在AT&T的先驱工作,以加权有限状态转换器(WeightedFinite State Transducer,WFST)为框架的大词汇量连续语音识别系统受到了国内外研究机构的关注,目前许多主流的语音识别系统均采用这一框架,如美国IBM、AT&T、日本Titech、瑞士IDIAP等。基于WFST的语音识别系统包括两个阶段:搜索网络的编译和Viterbi解码。本文研究目标是搭建一个基于加权有限状态转换器的语音识别系统。本文工作主要集中在第一阶段,即构建首选识别(1-best)和多候选词图识别(lattice)任务的中、英文搜索网络。我们首先将语音识别中的各种知识源表示成加权有限状态转换器的格式,并使用组合操作将其进行组合得到一个完整的搜索网络,然后使用优化操作对搜索网络进行优化,优化后的搜索网络被等价地转换成有限状态图(Finite State Graph,FSG)的格式,FSG格式的搜索网络在内存中更加紧凑,更适合Viterbi解码。最后,使用实验室开发的通用Viterbi解码器GrpDecoder在FSG格式的搜索网络中进行解码实验。本文分别在中、英文下进行了1-best和lattice实验。大量实验表明,本文构建的识别系统在1-best识别中明显优于HTK和传统的两阶段识别系统,相同识别速度时实现了更低错误率;在lattice识别中取得了与HDecode相当的性能,且优于两阶段系统。另外,实验还表明,在相同的词图错误率下,新系统生成的词图密度要远小于HTK和两阶段识别系统生成的词图密度,这表明新系统产生的词图更加紧致和高效。
其他文献
视频文字自动提取对提高视频内容的整体理解程度具有重要意义.在复杂背景下,现有提取方法难以稳健地定位文字和有效抑制背景干扰.我们提出一种复杂背景下稳健的视频文字提取
<正> 《金匮要略·水气病脉证并治第十四》篇有关气分病的论述共3条(依中医学院《金匮要略》1964年二版教材条文号为30、31、32)。《医宗金鉴》认为,31条“气分,心下坚,大如
高校是培养我国优秀人才的重要场所,加强对高校大学生学生干部队伍的建设和培养,有利于提高高校的学生管理水平和管理效率,提高大学生人才培养效率,从而为国家培养出符合社会
我国城市商业银行公司治理结构的严重缺陷表现为股权同质、三会制度缺位、内部人控制等诸多方面;其产生的严重危害和金融业愈演愈烈的竞争使得完善城市商业银行治理结构刻不
从河北省平山县城乘车出发,经半小时路程,便到了平山镇南西焦村。村南山坡上的核桃园里,一些男男女女正在忙碌着给片片相连的核桃树除草、施肥、浇水、补栽。核桃园的主人齐孟海
随着面向服务的体系架构(SOA)的出现,基于Internet环境下实现资源共享和业务集成的应用系统成为商务应用系统的发展方向之一。在开放网络下,Web服务的大量涌现使得如何快速发现满
多媒体以其直观、活泼、真实、有趣、内容丰富、信息量大的优势赢得学生青睐。本文探讨了多媒体在外语专业选修课《宾馆英语》教学中为学生提供的广阔学习空间。这些空间对培
<正>心理学是一门充满魅力的学科,有用又有趣。然而,心理学在社会上频遭误解却是一个不争的事实,科普之路任重道远。本刊从本期起开设新栏目"趣谈心理学史"介绍心理学史上的
<正>例1薛某,男,26岁.1992—07—20诊.发热呕吐泄泻于2日前发病.炎天暑热劳作,汗出心烦,口渴,饮冰镇汽水2瓶.2小时后出现肠鸣腹痛,继之腹泻日十余行,经口服庆大霉素、黄连素2
目的:将经皮二氧化碳分压监测的研究成果应用于喷射通气辅助下硬质支气管镜治疗,探讨一种更适合硬质支气管镜治疗的通气方式。方法:选择行硬质支气管镜治疗的病人30例,根据随