维吾尔语孤立词和连续数字语音识别设计与实现

来源 :第十一届全国民族语言文字信息学术研讨会 | 被引量 : 0次 | 上传用户:wdc145
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文小词汇量特定人维吾尔语孤立词语音识别是基于DTW识别方法,提取梅尔倒频谱特征参数,码本设计时使用LBG算法。每个单词对应的.vq文件,它充当参考模板库。在孤立数字识别的基础上,分析十个维语数字音子特性建立音子模型,Matlab6.2仿真基于聚类的方法训练参考模式和LB+Viterbi识别算法,直接对HMM模型输出的音子类别串分析而得识别结果,它可以完成不定长度数码串(本义测试了长度为2、3、4的数字串)的识别任务。
其他文献
本文以其他语言特别是以汉语近几年的韵律特征基础研究和应用研究成果作为参考,针对我国少数民族语言韵律特征研究现状和所面临的问题,提出了面向语音合成的蒙古语韵律特征研究新思路。
在《信息处理用藏文词类及标记集规范》(征求意见稿)中,我们以索绪尔的组合关系和聚合关系或者陈望道先生所论的"配置"与"会同"的理论,美国描写语言学的分布分析,布龙菲尔德提出的形类等作为理论依据,通过分析语言学界提出的三个分类标准,最终提出了语法功能标准为主,形态、意义标准为辅的分类方法。我们认为,只有抓住了词的语法功能才能把握研究词类的实质,以及有效地探求和阐明词的句法成分能力、与别的词组合的语言
本文主要讨论了维吾尔语生成句法研究及其句法规则,基于规则的维吾尔语句法分析方法与基于LR算法的维吾尔语句法分析方法.
蒙古文是一种拼音文字,她的语音合成研究上,过去主要以音节拼接的方法为主.但是由于蒙古文发音的特殊性,没有一个自然度很高的合成方法。本论文主要讨论以整词为主,与音节拼接结合的蒙古文语音合成的思路,方法和关键技术。
本文以终端用户角度分析了内蒙电视台目前使用的非线性编辑软件中字幕系统支持蒙古文方面的几个问题并提出了自己的改进意见。蒙古文字幕系统中存在的问题大致可分为字体方面、输入法方面及非编软件方面的问题.通过单方面的技术改进大多数问题可以得到解决.但,部分问题需要两个方面甚至是三方面相结合才能解决。本文深入讨论了蒙古文字幕软件的兼容问题、混编问题、字幕断裂、字体修饰、整词折行、标点禁则、横向唱词、字母不全、
本文概述了我国民族文献信息化建设现状,阐述了在新时期加强民族文献信息化建设的重大意义,从资源管理、数据库建设、共建共享、课题开发、人才培养等几个方面探讨了民族文献的信息化建设.
本文介绍了多语言农业知识处理平台的基本结构,其中遇到的几个基本问题:控件中的民族语言显示问题,语言模型与翻译模型训练问题,翻译通信问题。本文对这几个问题提供了解决方案,最后以汉蒙双语农业技术咨询系统为例,介绍具体的实现与应用。
语料库是研究语言特性的基础设施,藏语语料库是深入研究藏语特性的前提.本文通过对藏语单语生语料库的分析和标注的过程及规则进行讨论,得到了时于词法分析、短语分析.语法添加信息分析和语义分析方面的标注方案,为进行藏语单语生语料库的进一步处理作了一些准备.
壮汉英词典的编纂和出版需要进行大量的录入、校正、排序和输出工作,因此花费时间较长。特别地,壮语词条的排序较为复杂,完全采用人工排序容易出错。研发壮汉英词典编纂信息管理系统,通过计算机进行词条录入编辑、检索和排序,可以极大地提高编纂、更新出版壮汉英词典的效率。
本文阐述了藏文吾美长腿体字库的设计原则及制作字符的方法,字体结构比例,笔画式样,笔顺特色,整体调式这些方法.