藏文文语转换系统关键技术研究

来源 :青海师范大学 | 被引量 : 0次 | 上传用户:hnsushiheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息技术高度发达的今天,伴随着大数据时代的来临,人类对应用计算机处理信息的需求与日俱增。利用计算机处理语言文字一直是计算机应用领域热门的研究方向,文语转换技术(TTS)的诞生是计算机对语音文字处理的重要成果,它对文字信息进行处理,将其转换成流畅的能理解的语音信号并输出。文语转换技术在日常通讯,人机交互,人工智能等领域发挥着重要作用。对文语转换系统的研究国内外早在上世纪90年代就已经开始,并且成功的开发出了对应用相对广泛的语言的文语转换系统,如汉语、英语、法语等。在国内对部分少数民族语言的文语转换系统的开发也取得了令人瞩目的成果。藏族是我国民族体系的重要组成部分,藏族主要分布于我国西藏、青海、四川、甘肃等省,随着科学技术的发展和国家道路工程的建设,越来越多的人会选择去青海、西藏等地旅游参观,这样也加快了藏文化与其他民族文化之间的交流与融合。为了更加高效的使藏族朋友与其他民族进行文化交流,对藏文文语转换系统的研究具有重大意义和广泛的应用前景。本文主要研究工作如下:1.在对藏文结构和书写文法做研究的基础上,选择藏文音节作为基元,通过对藏文音节中每个藏文字符的特征选择和提取,构建藏文音节特征向量。2.从藏文文法出发,讨论了藏文文本中每一种音节的基字位置,并且建立了特殊基字音节库。使得系统可以准确判断藏文音节中基字的位置。3.分别构建了依据藏文音节结构的藏文音节特征向量库和依据藏文音节内字符数量的藏文音节特征向量库。通过音节特征向量在音节库中进行检索的方式解决文本识别问题。4.根据应用时的语音合成方式,建立了两种藏语语音库,分别为藏文音节语音片段库,和基于混合激励与LPC语音编码的压缩语音库。根据上述研究成果,构建了一个藏文文语转换系统。通过在MATLAB环境中实验验证,该系统在特征向量库数据充足的情况下可以正常工作。
其他文献
针对如今教师不当的教育行为对教学工作和学生教育工作的负面影响,本文分析了教师不当教育行为的三种情况,并提出了教师要改进教育观念,积极开展心理健康教育的对策及解决方
有人说语文课堂教学应该“使课堂适合儿童.而不是使儿童适合课堂”.因此.我们努力思考和探索为学生组织一个健康的课堂生态系统.意在让学生在成长中呈现生命的生长姿态。
随着经济的发展,人民对生活的质量提出更高的要求,同时人民深受“食药同源”文化影响,保健食品行业迅速蓬勃发展起来,近几年来,全国各地爆出各类保健食品违法行为,使得广大公众对保健食品产生严重的信任危机。本研究以梧州市藤县的保健食品监管满意度调查问卷数据为基础,主要是从人口学特征及保健食品知识宣传、投诉举报处理效率、执法人员的业务能力、日常监管强度、抽检力度、违法行为的打击力度、保健食品安全信息公开程度
地方文化资源是大学生思想政治教育的重要内容和载体,同时地方高校对于地方文化的保护、传承和推广也起着至关重要的作用。加强和改进大学生思想政治教育工作,事关国家前途和
一、认识简约简约是什么?一种时尚潮流?一种文化倾向?一种艺术家理想主义的探索?它可以是以上的全部,也可能什么都不是。它是一种被建筑师、画家、音乐家、作家在过去几年中
新闻产业的蓬勃发展对高校新闻学教育提出了新的要求。现代新闻学教育只有通过多学科嫁接、产学研结合和开放性办学 ,所培养的新闻人才才能适应新闻产业的需要 ,不能再囿于狭
马克思把传统伦理学对个体的道德关注转向了对阶级和制度的道德关注,把伦理的主体和客体从个人转变为阶级和社会制度。马克思伦理思想的总体性质是“制度伦理”。马克思强调
蒙古族科尔沁萨满教受地域环境、生产方式和历史演变的影响,带有鲜明的多元文化特征。科尔沁草原是蒙、汉杂居的地区,是游牧文化和农耕文化相交融地带。17世纪藏传佛教开始深
1624年2月,科尔沁部与后金缔结联盟并盟誓。对此史书虽有记载,但没指出盟誓的具体地址。盟誓地址对研究科尔沁蒙古史至关重要,因为很多历史事件都是从这里展开的。在研究史料