一种快速的语音识别词图生成算法

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:dusl520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词图的高效生成算法是语音识别领域的重要研究课题。该文提出了一种基于词格的词图生成算法(trellis-based lattice-generating algorithm,TBLG),该算法在正向Viterbi解码生成的词格(trellis)基础上,进行反向A*解码生成词图。实验结果表明,与经典的解码器HDecode相比,TBLG生成的词图最优备选效果优于Hdecode。生成高密度词图时,TBLG在解码速度上远远快于HDecode。同时在相同识别率下,TBLG算法生成的词图更加简洁。 The efficient generation of word map algorithm is an important research topic in the field of speech recognition. This paper presents a trellis-based lattice-generating algorithm (TBLG) based on the trellis, which is based on the Trellis generated by the forward Viterbi decoding. The trellis-based lattice-generating algorithm Word map. Experimental results show that, compared with the classical decoder HDecode, the best candidate word graph generated by TBLG is better than Hdecode. When generating high-density word maps, TBLG is much faster in decoding speed than HDecode. At the same time, under the same recognition rate, the word map generated by TBLG algorithm is more concise.
其他文献
The rapid variation of channel can induce the intercarrier interference in orthogonal frequency-division multiplexing (OFDM) systems. Intercarrier interference
针对传统的隐含马尔可夫模型(hidden Markov model ,HMM)存在的缺陷,该文提出了一种在识别的后处理阶段使用段长模型的方法,并应用在基于HMM的汉语识别系统上。该方法利用归一化
多口音英语学习者口语语音库(CELSCOM:Chinese EFLLearners speech corpus with multi-accents )旨在收集和建立中国不同方言区英语学习者的英语口语语音,一方面为英语语音识别
会议
面向有正音功能的对外汉语计算机辅助发音训练(CAPT)语音语料库的创制与标注是一个新的课题。本文介绍北京语言大学对外汉语CAPT语音语料库的建设思路与方法。该库分两期建设
会议
英音和美音是最为常见的英语目标口音。本文针对英语学习者存在的英美口音混杂现象,提出一种英美口音模型融合方法,提高发音质量评价性能,并压缩声学模型规模以适于嵌入式实现。
会议
本文分析讨论了连续语音识别系统中的快速高斯计算问题。语音信号的短时平稳特性,使得相邻语音帧可能共享相似的分布。利用该特性,估计当前帧与基准帧间似然值增量的最大值,以此
会议
本文介绍了参加DARPA GALE中文评测时,IBM开发的系统和算法最新进展。同时给出了在三个测试集上的识别结果,包括广播新闻和广播访谈类节目。结果显示,IBM GALE中文识别系统取得
利用分数阶付立叶变换(FrFT)在时频分析上的特点,提出一种新的谱减法-分数阶谱减法。首先,对每一帧带噪语音进行的分数阶付立叶变换,通过使得分数阶谱减法的信噪比达到最大从而
在语音识别领域,针对具体的任务进行分析进而挑选自适应数据,往往能够获得更好的自适应效果。本文提出一种基于任务分析的声学模型自适应方法,该方法针对特定任务,分析任务相关语
在当前的中文信息处理中,对短文本进行模糊匹配有广泛的应用。而现有的模糊匹配算法时间复杂度常常无法满足实际的在线需求。本文从索引检索代替顺序计算的思想出发,提出了基于