神经网络汉语TTS韵律模型的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:yeaGem
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于计算机技术、多媒体技术和信息技术的发展,语音技术迅猛发展并取得了很大进步.为获得较好的人机交互环境,对TTS技术的研究引发空前的兴趣并得到广泛的应用.TTS汉语文本到语音的转换是指通过软件和硬件将汉语文本或字串转换为汉语输出语音.目前有常用的两种TTS合成技术--基于规则合成和波形拼接合成,本文重点介绍波形拼接技术---PSOLA算法.PSOLA算法可以在保持语音自然度的情况下通过改变基频和时长从而改变给定信号的韵律和幅度生成语音语料.TTS系统有三大模块--文本处理、韵律分析和语音合成,文本处理和韵律分析主要是提取语音合成所利用的各种韵律控制参数,如合成语音韵律短语的结构和音节之间的韵律信息等.这些参数受韵律实现策略和语言学韵律规则的影响,对语音合成自然度起关键作用.目前由于缺乏比较好的韵律处理算法,精确提取韵律参数比较困难,合成效果较差,所以目前的研究主要集中在提高合成语音的自然度.利用人工神经网络优良性能进行韵律处理可提高语音的自然度.由于汉语是不同于其它语言的有调语言,在提取语音参数时有着自己的规律.汉语韵律是受语境影响的层次结构,而神经网络的运行和学习速率也极大的受到语境信息的影响,语境信息有着重要的作用.神经网络结构比传统模型更好地反映了汉语的韵律.在汉语TTS系统韵律模型中改善文本处理能力可提高汉语语音合成系统的语音输出质量,针对上述问题,本文提出了竞争型神经网络在汉语TTS(TEXT TO SPEECH)韵律建模中的应用,通过输入多个不同韵律特征的模板样本的竞争,最终选择与自然语音最匹配的那个样本模板,听辨的结果证明,竞争型神经网络模型合成语音的自然度得到进一步的提高.目前,自然语言识别理解技术和数据挖掘技术在汉语TTS系统中得到广泛应用,语音技术与多媒体技术相结合促成了由文本到可视语音的转换(text-to-visual speech,TTVS)的实现.
其他文献
随着互联网技术的不断发展,电子商务已经成为商业领域中非常重要的一部分,而电子商务中大部分的信息是通过互联网进行传输的,往往需要对其加密以保障其安全性。但目前电子商务安
由于CDMA扩频码集的不严格正交在各个用户间将会产生多址干扰,而多址干扰的存在不仅限制了系统的容量,而且严重影响了系统性能.多用户检测技术作为抗多址干扰有效的解决方案,
结构健康监测技术可应用于检测基础设施早期创伤和灾害预防。基于布里渊散射的分布式光纤传感技术,利用应变和温度与布里渊频移相关的特性,可以在数十到数百公里的尺度上上实现
该文从等效折射率模型出发,对于光子晶体光纤的一些传输特性:模式特性、色散、损耗等方面进行了详细的分析,得到了一些有益的结论.在色散的分析中,推演了光纤波导色散的比例
目前,滇池水污染严重,入湖河流的水质对滇池有着非常重要的影响,加强入湖河流治理的研究对治理滇池意义重大。盘龙江是滇池流域最大的子流域之一,本文对盘龙江水环境容量进行了初
本文通过对荣华二采区10
近年来,滇池水体富营养化现象日趋加剧,大规模的蓝藻水华频繁发生。椭圆萝卜螺和螺蛳是滇池两种常见的水生腹足类。本论文首先调查了椭圆萝卜螺在滇池重富营养化区域的周年动
全球气候变化是当今学术和社会关注的焦点问题之一。气候变暖与陆地生态系统之间反馈机制的是生态学研究的重点和热点,极具科学意义。目前,从研究水平来看,气候变化对作物生长影响主要从温度、降水、CO2浓度和极端气候事件四个方面进行。温度是最重要的生态因子之一,温度上升将对生态系统造成重要影响。为了研究未来气候变暖对陆地生态系统的影响,科学家们进行了大量尝试,野外自然条件下的生态系统增温实验应运而生。增温实
伴随着工艺发展逐渐接近瓶颈,单核处理器的性能提升幅度越来越小。多核处理器的研究逐渐成为提升处理器性能的主流研究方向。对于移动通信应用来讲,多核处理器具有不可比拟的灵
随着全球移动通信业务的迅速发展,如何更好地消除各种干扰成为人们在提高无线通信系统性能时考虑的主要因素。智能天线利用数字信号处理技术,产生空间定向波束,使天线主波束对准