面向藏语统计参数语音合成的文本分析方法研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:define_misser
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在语音合成的研究中,基于HMM的统计参数语音合成近些年在汉语等成熟语种中的广泛应用的同时,也逐渐开始应用在藏语等少数民族语言在内的语言学的研究中,文本分析对合成语音的自然度和清晰度有着很大的影响,然而现阶段藏语语音合成过程往往忽略前端文本分析的研究,因而藏语文本分析的研究还处于起步阶段,该方法的训练阶段和合成阶段的研究都需要经过必要的文本分析阶段,在训练阶段我们主要通过文本分析获取后端合成阶段所需要的单音素标注和上下文相关标注等标注信息,在合成阶段我们也需要通过文本分析获取藏语文本的上下文相关标注信息,其中单音素标注信息指的主要是输入的藏语文本的声韵母信息,上下文相关标注信息指的是声韵母层、音节层、词层、短语层和句子层等五层的标注信息及其位置信息。本文的研究目的在于通过藏语文本分析获取文本的单音素和上下文标注信息,实现自动标注对手工标注的替换。  论文的主要工作和创新如下:  1.设计了藏语拉萨话语音合成语料库。藏语属汉藏语系,也是一种常用的少数民族语言,本文在研究过程中主要是针对具有典型代表性的藏语拉萨话,通过大量藏语语料的筛选,构建了一个具有典型代表性的800句藏语小语料库和2000句的大语料库,并且邀请了我校民族学院的两名藏族男同学和两名藏族女同学在专业的录音棚里进行了声音语料的录制,以确保后端合成高质量的语音。  2.通过藏语语料的筛选,设计了一个包含藏语声韵母、音节、词、短语在内的藏语词典库,以便后端正向最大匹配算法的使用。鉴于本文研究的目的是获取藏语文本的单音素标注信息和上下文相关标注信息,因为藏语音节间和藏语句子间都有一个特殊的藏文符号,因而本文便利用此符号设计算法获取文本音节信息和句子信息,通过藏语基字丁的分解获得其声韵母信息,本文中运用基于词典库下的最大匹配算法获取文本的词和短语信息等,在上下文相关标注的获取中,设计了五层标注格式,并设计算法以获得输入藏语文本的上下文标注信息。  3在HTS中对本文文本分析方法所获得的标注信息进行了统计参数语音合成。最后,为了验证合成语音的质量,我们对合成语音进行了MOS和DMOS主观评测,在800句语料库下,其合成语音平均MOS得分和DMOS得分分别为3.0分和3.3分,这表明本文文本分析方法在后端合成语音自然度和相似度方面是可行的。
其他文献
味外之味,是唐代司空图讲诗的审美特征,它以食物为喻,认为食物之美,味在“酸咸之外”.在艺术的创作上,除了我们时常提及的“有意味的造型”这方面之外,其“味”也应都在“酸
期刊
研究背景:   随着我国社会经济的发展以及居民膳食结构、营养状况的变迁,肥胖和2型糖尿病等代谢性疾病在我国的患病率急剧上升,极大地影响了居民生活质量,增加了国家和个
学位
激光混沌保密通信理论与应用研究,越来越受到了广泛重视,其技术的突破,必将对保密通信,特别是对军事保密通信产生革命性的影响.该文主要研究激光混沌及其同步理论、混沌信号
目前流行病学研究表明高同型半胱氨酸血症与胰岛素抵抗有密切的联系。但是,关于高同型半胱氨酸血症是否是通过影响肝脏中糖原合成和糖异生,来损害葡萄糖动态平衡仍然不清。在本
目前,在城市化进程逐渐加快的形势下,房屋建筑施工的规模也在慢慢的延伸,在建筑施工过程中,最为关键的一个阶段就是地基的处理,这直接关系到建筑安全质量与寿命,所以还得要从
论文的主要内容如下:首先,介绍了国际电信联盟建议G.983规范的ATM-PON系统,分析了该系统的组成、特点、关键技术及网络管理技术,并扩展综合了宽带综合业务数字网和ATM的部分
ⅠK型小麦雄性不育系六倍体及相应单倍基因表达的差异分析   K型小麦雄性不育系由于核质互作会产生一定频率的单倍体。前人研究了单倍体的产生频率,从细胞学角度和遗传角
汽车前照灯反射器的设计是一个系统的工程,把计算机辅助设计技术引入到汽车前照灯反射器设计这一领域,将有力地促进其设计方法的发展.首先,该文介绍了一般的灯具设计概论,在
汽车灯具(配光镜)的设计是一个系统的工程,把计算机辅助设计引入这个领域,将有力地促进其设计方法的发展.该文主要介绍了汽车灯具配光镜仿真设计程序的开发,这套软件对汽车灯
随着人类社会生产力的大幅提高及人口压力的不断增大,全球范围的淡水水体富营养化现象日趋严重,由此引起的蓝藻水华在世界范围内频繁暴发,伴随其产生的毒素与动物及人类健康