面向语音合成的缅甸语文本分析与实现

来源 :云南大学 | 被引量 : 0次 | 上传用户:zhaojingda08
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
缅甸语是缅甸的官方语言,属汉藏语系藏缅甸语族缅甸语支,与同语系的汉语和藏语语音合成研究相比,缅甸语语音合成相关研究亟待重视。本文以开发缅甸语语音合成系统为目的,构建发音语料库,研究并实现文本归一化、分词和文本注音。本文的主要工作包括:(1)构建发音语料库。从缅甸语网站上抓取大约600M原始文本语料,去除语料中的非法字符和重复句子,并统一文本语料的字符编码方式。统计文本语料库中的高频词、句子长度、句子类型、声韵母的分布,将其作为发音语料选取的依据;为了使发音语料库包含的发音现象、语言现象更加完整,通过句子之间的相似度比较作为另一个选取依据;最终挑选出的发音语料库规模为5000句。(2)文本归一化。研究了数字、缩写词以及特殊字符的归一化问题,对不同类型的字符分别提出了具体的归一化方案并进行了实现。(3)实现三种分词方法。设计并实现了基于正向最大匹配(Forward Maximum Matching,简称FMM)的分词、基于条件随机场模型(Conditional Random Fields,简称CRF)分词以及基于双向长短期记忆神经网络+条件随机场模型(Bidirectional Long Short-Term Memory Networks with a CRF layer,简称BiLSTM+CRF)的分词。实验结果表明,三种方法的分词速度比较结果为:FMM>CRF>BiLSTM+CRF,分词精度比较结果为:BiLSTM+CRF>CRF>FMM。CRF方式与BiLSTM+CRF方式相比,分词精度略差,前者的分词速度为后者的62倍。综合考虑,选择基于CRF的分词方法应用于缅甸语语音合成系统开发的分词模块。(4)文本自动注音。根据MLC(The Myanmar Language Commission)转写系统和IPA(International Phonetic Alphabet)注音系统提出基于声韵母拼接的文本自动注音方法。缅甸语是一种文白异化现象较多的语言,通过对语音变化情况进行分类,选择涵盖大部分语音变化现象的四种模式,在声韵母拼接注音的基础上,提出基于规则的注音方法和基于CRF的注音方法。通过对比实验与结果分析,基于CRF的文本自动注音方式优于其它两种,且其词和音节的标注正确率的均值分别为71.6%和90.6%,音标正确率的均值分别为63.6%和86.8%。
其他文献
测验等值是指将考核同一心理品质的不同测验形式上的被试能力水平和项目参数转换到统一的单位系统中,使之能够相互比较的过程。在等值设计中,非等组锚测验是目前应用最多的方法。然而,在实际的锚测验的设计、编制和施测过程中,往往会有很多不可控的影响因素,致使抽样施测时的被试能力分布形态存在一些不规则的情况,从而影响锚测验的质量,影响锚测验的施测效果,进而影响测验等值的效果。本研究基于两参数逻辑斯蒂克模型,采用
本研究是关于短篇小说《画骨》的三种语言翻译—翻译成英文和法文—的翻译报告。此短篇小说的作者为中国作家谷第,虽然属于科幻类作品,其中包含不少和中国文化有关的元素。小说的故事背景是在不远的未来的北京,那是一个人体意识的复制和储存十分流行的时代,讲述的是一个警察对意识绑架案件的刑事侦查故事。此翻译报告主要展示了笔者对三种语言的翻译处理手段以及在翻译过程中遇到的特殊挑战。本翻译实践报告第一部分分析了原中文
精确、快速的挤奶奶牛个体识别技术是自动化养殖的重要组成部分,对保障奶牛健康、提高养殖场的管理能力和生产效益具有重要作用。针对传统人工耳标法识别效率低、易磨损、占
具有半导体特性的单层二硫化钼(1H-MoS2)以其卓越的物理化学性能,成为了纳光电子器件领域里备受推崇的应用材料之一。然而,目前针对现实制备过程中普遍存在的固有缺陷对其力
近年来,四参数逻辑斯蒂克模型重新引起研究者们的兴趣,但由于精确、稳健且实用的参数估计方法的缺失而一直未得到广泛的应用。本文从潜变量混合模型的视角改写了四参数逻辑斯蒂克模型,提出了期望三重最大化算法(Expectation-3-Maximization Algorithm,EMMM),并在结合贝叶斯方法后得到了贝叶斯期望三重最大化算法(Bayesian Expectation-3-Maximizat
随着我国工业化进程的加快,工业自动化水平不断提高。物流这个劳动力密集的行业要想降低成本,提高自动化水平显得尤为重要。物流AGV(自动引导车)作为室内仓库中重要的运输设
近年来平板显示产业规模持续扩大,智能手机,平板电脑等电子产品的兴起使得平板显示屏生产制造规格越来越大。在液晶面板生产过程中对其进行缺陷检测,则可以在确保产品良率的
计算机视觉在当今工业物联网中发挥着重要的作用,而图像识别是计算机视觉中最重要的部分之一,卷积神经网络算法由于其较高的识别精度成为图像识别的首选。在很多图像识别应用中,由于对实时性有一定要求,所以神经网络的推理需要在本地硬件上执行,如无人机的碰撞检测等。并且由于GPU功耗较高,限制了其在功耗与资源有限的嵌入式平台上使用,因此需要一种高能效、可配置的卷积加速器来满足卷积神经网络算法在嵌入式平台上的应用
过去的几十年中,由单目相机多方位拍摄的二维图像序列恢复三维非刚体结构NRSFM(non-rigid structure from motion)是机器视觉领域的研究热点之一。但处理NRSFM问题困难重重,
羁押场所作为国家的刑罚执行的重要设施,具有监控管理犯人的重要职能,高水平的管理可有效防止犯人逃脱再次危害社会。最近,羁押场所的押量犯人的数量持续上升,人控管理的传统