汉藏双语跨语言语音合成的研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:feijin4fhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,跨语言语音合成已成为研究热点。中国是一个少数民族语言众多的国家,跨语言语音合成的研究对促进少数民族语言语音技术的发展有着重要的意义。英语的研究表明可以借助于英语与少数民族语言一起进行跨语言语音合成。对藏语来说,已经实现了基于隐马尔科夫模型(Hidden Markov Model,HMM)的汉藏双语语音合成,但该方法存在的两个问题:  1.如何实现汉藏双语的情感语音合成,以提高合成汉藏语音的表现力?  2.近年来深度学习已在语音合成中成功应用,深度学习能否提高汉藏双语跨语言合成语音的音质?针对以上两个问题,本文用普通话的情感语料实现了汉藏双语的情感语音合成,解决了第一个问题。  用深度神经网络(Deep Neural Network,DNN)代替HMM进行声学模型训练,实现了基于DNN的汉藏双语语音合成,解决了第二个问题。  本文完成了以下创新和工作:  1.利用普通话的情感语料,实现了基于HMM的汉藏双语情感语音合成。根据普通话和藏语在发音和情感表达上的相似性,利用普通话的情感语料,实现了三种基于HMM的汉藏双语情感语音合成方法。主观评测和客观评测表明,三种方法均能合成高质量的汉语和藏语的情感语音。  2.利用深度神经网络DNN代替HMM进行声学模型训练,实现了基于DNN的汉藏双语语音合成。在基于HMM的语音合成框架下,将HMM里的声学模型用DNN代替,实现了基于DNN的汉藏双语语音合成。主观评测和客观评测表明,相较于传统的基于HMM的汉藏双语跨语言语音合成方法,本文提出的方法合成的普通话和藏语语音音质都较优。
其他文献
学位
2013年11月3日,由江苏省文联、无锡市委宣传部主办,无锡市文广新局、无锡市文联、无锡市文化艺术管理中心执行主办,江苏省美术家协会学术支持,无锡市美术家协会、《书画艺术
抑癌基因LKB1在约30%的人非小细胞肺癌中存在功能性缺失突变,前期研究显示这些突变显著性地促进了肺癌进展和转移,但其作用机理尚不明确。本课题中,发现CRTC1-NEDD9信号轴通过上
花药和胚珠分别是开花植物产生雄配子和雌配子的生殖器官,对育性和生产应用极其重要。花药多是由两侧对称排列的四个药室(小孢子囊)组成,每侧两个药室之间为开裂区;花粉粒在每个
软件无线电(Software Defined Radio)的出现为各种通信系统互连互通的实现提供了可能,满足现代通信发展的需要。而中频调制解调技术在软件无线电系统中占据着非常重要的地位,
目的:研究脑梗死大鼠脑组织生长分化因子-15(GDF-15)的表达及其与神经功能及Smad2、Smad4、p21水平的关系,探讨GDF-15在脑梗死中的作用及可能机制.方法:45只大鼠根据随机数字
随着多媒体编码技术的发展,视频压缩标准在很多领域都得到了成功应用,如视频会议(H.263)、DVD(MPEG-2)、机顶盒(MPEG-2)等等,而网络带宽的不断提升和高效视频压缩技术的发展
全光通信是未来通信的发展趋势,密集波分复用(DWDM)技术是光通信中的关键技术,而复用器/解复用器(MUX/DMUX)又是DWDM系统中的关键器件。阵列波导光栅(AWG)作为MUX/DMUX中的佼佼者,重要
近年来随着科技的进步和生活水平的提高,人类对定位技术的要求也越来越高。基于卫星的室外定位技术发展成熟,但是在有障碍或者室内空间中无能为力。研究室内定位技术也成为了
代谢综合征是现今社会面临的重大问题,胰岛素抵抗是代谢综合征的重要表征并在代谢综合征发生发展过程中起核心作用。主流观点认为炎症反应与胰岛素抵抗密切相关。炎症反应的