基于HMM的维吾尔语连续语音识别系统

来源 :第二届全国少数民族青年自然语言处理学术研讨会 | 被引量 : 0次 | 上传用户：fh1130

【摘要】

：

维吾尔语是黏着性语言，利用丰富的词缀可以用同样的词干产生超大词汇，给维吾尔语语音识别的研究工作带来了很大困难。本文结合维吾尔语自身特点，建立了维吾尔语连续语

【作者】

：

那斯尔江·吐尔逊[1] 吾守尔·斯拉木[2]

【机构】

：

西安交通大学电子与信息工程学院,西安陕西710049新疆大学数学与系统科学学院,乌鲁木齐新疆830046新疆大学信息科学与工程学院,乌鲁木齐新疆830046

【出处】

：

第二届全国少数民族青年自然语言处理学术研讨会

【发表日期】

：

2008年10期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

维吾尔语是黏着性语言，利用丰富的词缀可以用同样的词干产生超大词汇，给维吾尔语语音识别的研究工作带来了很大困难。本文结合维吾尔语自身特点，建立了维吾尔语连续语音语料库，利用HTK(HMMToolKit)工具实现了基于HMM(Hidden Markov Model)的维吾尔语连续语音识别系统。在声学层，选取三音子作为基本的识别单元，建立了维吾尔语的三音子声学模型，并使用决策树、三音子绑定、修补哑音、增加高斯混合分量等方法提高模型的识别精度。在语言层，使用了适合于维吾尔语语音特征的基于统计的二元文法语言模型。最后，利用该系统进行了大量的识别实验。

其他文献

实施新的国际压载水控制与管理公约的相关思考

随着国际社会对海洋环境保护的日趋严格,近些年来人们意识到;以往国际防污公约中尚未涉及的、有关船舶压载水中的外来水生物的生物侵害对海洋环境造成的严重伤害已不容低估。

会议

国际海事组织海洋污染压载水管理沉积物控制

1999年全国血吸虫病疫情通报

1　 1 999年全国血吸虫病分布1 999年全国流行血吸虫病的 1 2个省 (市 )中 ,共有地区、地级市 1 63个 ,其中 87个为血吸虫病流行区。 1 2个省 (市 )共有 1 2 1 3个县 ,40 9个

期刊

血吸虫病疫情血吸虫病急性血吸虫病有螺面积扩大化疗血吸虫病疫区钉螺面积病人数传播阻断流行区

一种基于短语统计翻译的汉维机器翻译系统

本文描述了一种基于短语统计翻译的汉维机器翻译系统。首先使用汉维语料进行训练，得到语言模型和翻译模型；再利用训练好的模型对源语句进行解码，以得到最佳的翻译语句。解码的核

会议

短语统计机器翻译系统语言模型语料训练核心算法解码翻译模型再利用搜索

基于GMM特征变换和模糊LS-SVM的说话人辨认

针对最小二乘支持向量机在语音数据大样本输入下的局限性,提出了一种基于GMM特征变换和模糊LS-SVM的学习算法,结合高斯混合模型在拟合数据分布方面和最小二乘支持向量机在分

期刊

特征变换GMMLS-SVM说话人说话人辨认高斯混合模型二乘辨别能力支持向量机模糊隶属度函数

班智达藏文查询接口及信息抽取的研究

本文依据班智达藏语料自动分词技术，设计出班智达藏文查询接口及信息西抽取总体功能结构，较详细地讨论了班智达藏文藏词性规范、词典库的数据结构和信息抽取的文法规则，并给出了

会议

藏文查询接口信息抽取文法规则数据结构功能结构分词技术抽取算法性规范词典库语料设计藏词

浅谈“铍中毒”的预防

铍是原子能、航空、电子、光学仪器和特种陶瓷等工业常用的一种轻金属 ,一般用量较多的铍化物有氧化铍、氟化铍、氢氧化铍、硫酸铍、氯化铍等。铍及其盐类的毒性是较大的 ,尤

期刊

铍中毒氯化铍氢氧化铍氟化铍慢性铍病金属烟雾热化学性肺炎呼吸道炎症毒性铍化合物

战伤410例二线医院续治回顾

1979～1987年，我们收治战伤410冽，给予再次清创、抗感染、取异物、截肢、植皮、植骨、软组织缺损修复和复位固定等处理，现作回顾性总结如下。临床资料本组均为男性青年，平均年龄21．3

期刊

二线医院伤道血管火器伤软组织缺损修复筋膜间隙一线救治男性青年清创术血管伤血管损伤

不同职业人群胆结石流行病学调查分析

期刊

胆结石职业人群胆结石患者查阅病历胆囊切除流行病学诊断符合率流行病学调查人群发病率日本阿洛卡

饮用酒中甲醇含量的现场快速定性半定量分析

在选择性氧化试剂作用下,甲醇被氧化至甲醛,乙醇不能被氧化至乙醛。以品红亚硫酸作显色剂检测甲醛。该方法最低检测含量为100mg/L(国家食品卫生标准规定:谷物类和薯干类饮用

期刊

甲醇含量饮用酒选择氧化试剂选择氧化光电比色计选择性氧化谷物类显色剂甲醛试剂

在线笔式输入中的符号切分问题研究

在维吾尔文和数学公式的笔式输入识别中，不能准确的对符号进行切分和处理是造成识别错误和系统运行效率低的重要原因之一，本文通过对符号切分问题的分析，提出了一种有效的符号切

会议

笔式输入符号行切分系统运行效率识别正确率维吾尔文数学公式识别错误处理方法实验

基于HMM的维吾尔语连续语音识别系统

与本文相关的学术论文