基于加权有限状态转换器的大词汇量连续语音识别解码器的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:lilinjun0954
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别技术作为一个计算机科学的热点研究领域有着深刻的理论研究意义和巨大的商业应用潜力。而大词汇量连续语音识别任务是语音识别技术中最具有实际应用价值的任务之一。在大词汇量连续语音识别任务中,解码器模块由于其实现的复杂性一直以来都是语音识别技术的核心问题。 本文采用以加权有限状态转换器(WeightedFiniteStateTransducer,WFST)为框架的静态搜索网络扩展技术,设计并实现了一个大词汇量连续语音识别解码器。 在搜索网络构建方面,本文利用合成算法对各层模型进行静态合并,并使用WFST的确定化和最小化算法对搜索网络进行优化,最后通过成分化(Factoring)的方法压缩搜索网络的规模。在搜索方面,本文采用Viterbibeam搜索算法,实现了在线最优结果解码和词网输出。 在标准评测语料Hub-4上进行的测试显示,本文所实现的解码器与采用动态词树搜索网络扩展方法的Sphinx3.3解码器在同等词错误率下,速度提高约50%。
其他文献
现代电子技术中,单个固态元件的功率很小,无法满足通信、雷达及其它大功率应用的要求,解决的办法就是用合成功率技术。而合成功率放大电路的设计和分析,是相当复杂的,按早期的设计
假肥大型肌营养不良症(Duchenne Muscular Dystrophy/Becker’S Muscular Dystrophy,DMD/BMD)是最常见的X-连锁隐性致死性遗传病之一,群体发病率高达1/3500男性活婴。进行性肌萎缩
值此《中国眼镜科技杂志》创刊30周年之际,作为贵刊20多年的忠实读者和老朋友,向贵刊致以最衷心的祝贺!rn作为眼镜人,谁对《中国眼镜科技杂志》都不会陌生.杂志30年来一直伴
期刊
微带天线具有许多优点,如体积小、重量轻、剖面薄、容易与载体共形、与集成电路的兼容性好、易于大批量制作等,在近几十年中得到了广泛的应用。但其主要缺点是频带较窄,因而限制
传感器技术、微机电系统、现代网络和无线通信等技术的进步,推动了具有现代意义的无线传感器网络的产生和发展。无线传感器网络通常由大量密集的传感器节点构成,节点的能源、
射频识别技术(RFID,Radio Frequency Identification)是一种非接触式的自动识别技术,是近年来出现的供应链物流信息及自动识别的最新技术,作为新兴的非接触式自动识别技术,与早期
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
由于无线网状网中的终端节点和路由器可通过多跳方式接入主干网络,因此它是一种很有前途并且廉价的“最后一公里”无线宽带网络接入方案。相对于移动Ad-Hoc网络主要考虑节点
随着音/视频等多媒体业务在互联网上的快速增长,人们对业务的延迟、延迟抖动、丢包率等服务质量指标的要求越来越高。目前的IPv4网络在地址资源、移动性支持、路由表容量、安
学位
波前处理机是自适应光学系统中所有实时信号处理和控制运算的核心。随着自适应光学系统的发展日趋成熟,系统子孔径数目和单元数不断增多,对波前处理机的性能提出了严格的要求,要