基于音节的维吾尔语大词汇连续语音识别系统

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:nextronnpf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维吾尔语是一种黏着语,基于单词的语言模型不太适合于维吾尔语大词汇连续语音识别任务。该文提出了适合维吾尔语的基于音节的语言模型,引入最大匹配分词算法评价音节语言模型在大词汇连续语音识别任务中的单词识别性能。实验结果表明:基于音节的语言模型在未登录词和模型复杂度等方面表现出比基于单词的语言模型更加优越的性能,并且使识别系统的单元错误率比基于单词的系统减少了50%。因此,在维吾尔语语音识别任务上可以将音节作为识别单元。 Uyghur language is a cohesive language, word-based language model is not suitable for Uyghur vocabulary continuous speech recognition task. In this paper, a syllable-based language model suitable for Uyghur language is proposed, and the maximum matching word segmentation algorithm is introduced to evaluate the performance of syllable language models in word recognition in large vocabulary continuous speech recognition tasks. The experimental results show that the syllable-based language model shows more superior performance than the word-based language model in terms of unregistered words and model complexity, and reduces the unit error rate of the recognition system by 50% compared with the word-based system. Therefore, syllables can be used as recognition units in Uyghur speech recognition tasks.
其他文献
综述了云母钛珠光颜料开发研究的新进展,分析了多覆层云母钛珠光颜料的优点.概括介绍了几种包覆法,最后指出今后云母钛珠光颜料的研究与发展方向.
通过双螺杆挤出机将马来酸酐熔融接枝聚乙烯,制备的聚乙烯热熔胶具有粘接性能强、价格低等优点,广泛地应用于钢塑复合管。本文根据近年来聚乙烯热熔胶的研究方向,综述了新型
目的探讨强迫症应用氟伏沙明联合氯米帕明治疗的效果。方法随机选取我院2015年3月—2018年3月间收治的80例强迫症患者,并将其均分为对照组(n=40)及研究组(n=40)。对照组患者
城市的建设和发展离不开文化,文化是城市的内核和灵魂,没有文化的城市是没有凝聚力、没有发展活力的城市。建立国家级铜鼓文化(河池)生态保护区是为了更好地保护和传承铜鼓文
为克服单一的杠杆铰链放大机构的弧形位移输出和三角形铰链放大机构放大倍数小等缺陷,设计了1种综合三角形铰链与杠杆铰链结构性能优点的放大机构,理论推导了放大机构的位移
在无论哪种类型的语言学习中,阅读都是基础,同样英语学习中阅读也是主要的评判依据,在初中英语教学中,阅读有着十分重要的地位。该文介绍了一种国际上应用较为成功的英语阅读
关于渝北全区实行最严格水资源管理制度,核心是把握三条红线的控制。
目的:探讨喉癌组织PTTG和PTEN基因蛋白表达与喉癌发生、发展的关系。方法:选择喉鳞癌标本50例,喉癌旁黏膜10例作为对照组,采用免疫组织化学SP法测定PTTG和PTEN的表达,分析PTTG和PT
卒中后疲劳是脑卒中发生后常见的并发症,其不仅严重影响患者生活质量,而且极易降低患者参与康复训练的积极性,造成整体康复效果不良。中医药治疗脑卒中具有悠久的历史,对卒中
<正>流水线的百年历史,因其垄断、毫无人性和环境危害饱受批评,直到现在也左右着阶级差异。流水线百年历史,底特律也许是最有资格对其功过做出评判的城市。如今,福特生产T型