基于加权有限状态机的动态匹配词图生成算法

来源 :电子与信息学报 | 被引量 : 0次 | 上传用户:cser905
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于现有的加权有限状态机(WFST)解码网络没有精确词尾标记,导致当前已有的词图生成算法不含精确的词尾时间点,或者仅是状态、音素级别的词图,无法应用到关键词检索中。该文提出在WFST静态解码器下的语音识别词图生成算法。首先从理论上分析了WFST解码音素图和词图的可转换关系,然后提出了字典的动态音素匹配方法解决了WFST网络中词尾时间点对齐的问题,最后通过令牌传递的遍历方法生成了词图。同时,考虑到计算量优化,在令牌传递过程中引入了剪枝算法,使音素图转词图的耗时不到解码耗时的3%。得到的词图,不仅可以用于语言模型重打分,由于含有精确的词尾时间点,还可以直接应用到关键词检索系统中。实验结果表明,该文的词图生成算法具有较高的计算效率;和已有动态解码器的词图相比,词图中包含更多解码信息,在大词汇连续语音识别的重打分结果和关键词检索中都能取得更好的性能。
其他文献
在我国社会发展的过程中,科学技术的水平也有了非常显著的提升。汽车维修技术在这一过程中也在不断的改进和完善,汽车的数量越来越多,所以汽车维修行业也成为了一个非常重要
<正>编辑同志:我是天津市社会保险缴费人员,缴纳养老和医疗两险,由于个体经营需要到外省市务工一年左右,请问天津市参保人员外出务工可否在异地就医联网结算?张怡张怡读者:根
采用TCA-丙酮沉淀法,改良优化了棉花蛋白质组研究中的双向电泳技术.通过对根和子叶全细胞蛋白的提取、蛋白的溶解、胶条的选择及电泳等环节的优化,得到了重复性很高、分辨率很好
本文旨在分析刘海粟首度欧游阶段艺术实践的探索状况.辨析画家对野普派与后印象派的理解与接受、在画面结构的建构和语言表现力方面的突破.以及精神特质的新的开掘。文章将特别
光学相干层析(Optical Coherence Tomography,简称为OCT)成像技术是一种新型的光学无损检测成像技术,是利用弱相干光,以迈克耳逊干涉仪为基本核心,通过检测材料或者生物组织
目前临床上根除幽门螺杆菌(HP)的方案主要以铋三联(铋制剂加2种抗生素)和PPI三联(抑酸剂加2种抗生素)为主.铋制剂与抑酸药物合用较少,可能考虑因pH高低的影响,可以联合运用.
2018年4月14日,由中国美术家协会主办,中国美术家协会油画艺术委员会、山东美术馆、鲁迅美术学院美术馆承办的“中国精神:第四届中国油画展(第三区段)抽象——当代中国非具象油
多囊卵巢综合征,是一种好发于育龄妇女的异质性内分泌紊乱疾病,临床多表现为月经不调、不孕、多毛、肥胖和卵巢囊性增大.笔者随师临床,见患者中以肥胖且月经后期者最为多见.
以实验为基础,采用正交设计法制定了以锦西青矸子和红矸子为主要原料的釉面砖坯料配方,并试制出低锆强乳浊釉.经检测,制品的各项技术性能均符合国家标准要求.
1资料与方法1.1资料(1)正常对照组:选择正常体检的男性干部,除外前列腺疾病及其它疾病的健康者163例,年龄在45~67岁间。(2)前列腺增生组:选择175例男性均为我科门诊及住院确诊