基于隐马尔可夫模型的维吾尔语连续语音识别系统

来源 :计算机应用 | 被引量 : 0次 | 上传用户:xsyangle
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
维吾尔语是黏着性语言,利用丰富的词缀可以用同样的词干产生超大词汇,给维吾尔语语音识别的研究工作带来了很大困难。结合维吾尔语自身特点,建立了维吾尔语连续语音语料库,利用HTK(HMMToolK it)工具实现了基于隐马尔可夫模型(HMM)的维吾尔语连续语音识别系统。在声学层,选取三音子作为基本的识别单元,建立了维吾尔语的三音子声学模型,并使用决策树、三音子绑定、修补哑音、增加高斯混合分量等方法提高模型的识别精度。在语言层,使用了适合于维吾尔语语音特征的基于统计的二元文法语言模型。最后,利用该系统进行了维吾尔语连续语音识别实验。 Uyghur language is a sticky language, the use of rich affixes can use the same stem to produce oversized words, Uygur language speech recognition research has brought great difficulties. Uyghur language continuous speech corpus is established according to the characteristics of Uyghur language. The Uyghur continuous speech recognition system based on Hidden Markov Model (HMM) is implemented by HTK (HMM Tool). At the acoustical level, the triphone is selected as the basic recognition unit, and a three-tone Uyghur language acoustic model is established. The model is identified by using decision tree, triphone binding, mending mute, and adding Gaussian mixture components Accuracy. At the language level, a statistical-based binary grammar language model suitable for Uyghur phonetic features is used. Finally, the Uyghur continuous speech recognition experiment is carried out using this system.
其他文献
随着科学技术的发展,信息技术在 教育领域的地位逐渐增大,而合作学习是小学信 息技术教学中的经典教学模式,因此我们探索合 作学习在小学信息技术课堂中的应用,促使学生 有效
三江平原1958年开始有计划开发,到1990年代末,湿地仅余1.6×104hm2,且极度破碎,环境恶化,有些种类已绝迹,现存种类亦处于濒危状态.丹顶鹤由开发初期的数千只,减少到1990
河南省有丰富的野生植物资源,有维管植物181科,966属,3158种。按经济用途可分为15类,其中用材植物474种,野生水果144种,观赏植物534种,淀粉植物140种,油料植物291种,纤维植物271种,药用
为郑58在玉米育种中应用提供参考,以玉米自交系郑58及其改良系H-1、H-2、H-3、H-4、H-5为母本,Mo17、PH5AD、丹340、PH4CV和昌7-2为父本,采用不完全双列杂交(NCII)设计,研究郑58及
本文以剧场理论为依据探讨服务型企业管理服务接触的策略,为服务型企业提升服务品质提供新的思路。
<正>怎样真正实现学生工学结合,在工作过程中实现岗位能力培养呢?广州珠江职业技术学院汽修专业探索了一条深度校企合作、厂校一体的人才培养之路。一、校企合作基础上的工学
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
读与写,是习作教学避不开的话题,关注读写结合的习作教学也成为主流。本期"主题"选择的两篇文章在读写教学方面都有各自的创新点。许继忠老师提出一种以"核心概念"为中心的聚
期刊