基于音节的维吾尔语大词汇连续语音识别系统

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户：nextronnpf

【摘要】

：

维吾尔语是一种黏着语,基于单词的语言模型不太适合于维吾尔语大词汇连续语音识别任务。该文提出了适合维吾尔语的基于音节的语言模型,引入最大匹配分词算法评价音节语言模型

【作者】

：

努尔麦麦提·尤鲁瓦斯吾守尔·斯拉木热依曼·吐尔逊

【机构】

：

新疆大学信息科学与工程学院,

【出处】

：

清华大学学报(自然科学版)

【发表日期】

：

2013年06期

【关键词】

：

维吾尔语语音识别音节语言模型最大匹配算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

维吾尔语是一种黏着语,基于单词的语言模型不太适合于维吾尔语大词汇连续语音识别任务。该文提出了适合维吾尔语的基于音节的语言模型,引入最大匹配分词算法评价音节语言模型在大词汇连续语音识别任务中的单词识别性能。实验结果表明:基于音节的语言模型在未登录词和模型复杂度等方面表现出比基于单词的语言模型更加优越的性能,并且使识别系统的单元错误率比基于单词的系统减少了50%。因此,在维吾尔语语音识别任务上可以将音节作为识别单元。 Uyghur language is a cohesive language, word-based language model is not suitable for Uyghur vocabulary continuous speech recognition task. In this paper, a syllable-based language model suitable for Uyghur language is proposed, and the maximum matching word segmentation algorithm is introduced to evaluate the performance of syllable language models in word recognition in large vocabulary continuous speech recognition tasks. The experimental results show that the syllable-based language model shows more superior performance than the word-based language model in terms of unregistered words and model complexity, and reduces the unit error rate of the recognition system by 50% compared with the word-based system. Therefore, syllables can be used as recognition units in Uyghur speech recognition tasks.

其他文献

云母钛珠光颜料的研究现状及发展方向

综述了云母钛珠光颜料开发研究的新进展,分析了多覆层云母钛珠光颜料的优点.概括介绍了几种包覆法,最后指出今后云母钛珠光颜料的研究与发展方向.

期刊

云母钛珠光颜料包覆着色多覆层

热熔胶用马来酸酐接枝聚乙烯研究进展

通过双螺杆挤出机将马来酸酐熔融接枝聚乙烯,制备的聚乙烯热熔胶具有粘接性能强、价格低等优点,广泛地应用于钢塑复合管。本文根据近年来聚乙烯热熔胶的研究方向,综述了新型

期刊

热熔胶聚乙烯挤出接枝率剥离强度

强迫症应用氟伏沙明联合氯米帕明治疗的效果研究

目的探讨强迫症应用氟伏沙明联合氯米帕明治疗的效果。方法随机选取我院2015年3月—2018年3月间收治的80例强迫症患者,并将其均分为对照组(n=40)及研究组(n=40)。对照组患者

期刊

强迫症氟伏沙明氯米帕明治疗效果

浅谈建立国家级铜鼓文化(河池)生态保护区对河池城市文化建设的影响

城市的建设和发展离不开文化,文化是城市的内核和灵魂,没有文化的城市是没有凝聚力、没有发展活力的城市。建立国家级铜鼓文化(河池)生态保护区是为了更好地保护和传承铜鼓文

期刊

铜鼓文化生态保护区城市文化建设

基于三角形和杠杆原理的柔性铰链放大机构

为克服单一的杠杆铰链放大机构的弧形位移输出和三角形铰链放大机构放大倍数小等缺陷,设计了1种综合三角形铰链与杠杆铰链结构性能优点的放大机构,理论推导了放大机构的位移

期刊

压电叠堆三角形杠杆柔性铰链放大机构对称性驱动

AIDA模式在初中英语阅读教学中的实践探索

在无论哪种类型的语言学习中,阅读都是基础,同样英语学习中阅读也是主要的评判依据,在初中英语教学中,阅读有着十分重要的地位。该文介绍了一种国际上应用较为成功的英语阅读

期刊

AIDA模式初中英语阅读教学实践探索

实行最严格水资源管理加强用水总量控制——重庆市渝北区实行最严格水资源管理措施浅见

关于渝北全区实行最严格水资源管理制度,核心是把握三条红线的控制。

期刊

最严格水资源管理用水总量控制措施

PTTG和PTEN在喉鳞状细胞癌中的表达及其临床意义

目的：探讨喉癌组织PTTG和PTEN基因蛋白表达与喉癌发生、发展的关系。方法：选择喉鳞癌标本50例，喉癌旁黏膜10例作为对照组，采用免疫组织化学SP法测定PTTG和PTEN的表达，分析PTTG和PT

学位

喉鳞状细胞癌免疫组织化学PTTG基因蛋白PTEN基因蛋白

从脾胃论治卒中后疲劳

卒中后疲劳是脑卒中发生后常见的并发症,其不仅严重影响患者生活质量,而且极易降低患者参与康复训练的积极性,造成整体康复效果不良。中医药治疗脑卒中具有悠久的历史,对卒中

期刊

卒中后疲劳脾胃中气病机

福特的流水线革命

<正>流水线的百年历史,因其垄断、毫无人性和环境危害饱受批评,直到现在也左右着阶级差异。流水线百年历史,底特律也许是最有资格对其功过做出评判的城市。如今,福特生产T型

期刊

福克斯流水线汽车工厂汽车制造商

基于音节的维吾尔语大词汇连续语音识别系统

与本文相关的学术论文