汉语语音合成系统的基频建模和优化

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户:zhouly1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于规则的语音合成系统在可懂度方面已经达到可以接受的程度,在自然度方面离人们的期望还有一定的距离.基频建模是提高汉语规则语音合成系统自然度所面临的主要挑战之一.本论文以自然语流的真实基频为研究对象,分别从反演和正演的角度,提出了新的基频模型并实现了韵律块基频曲线的优化.论文首先从反演的角度,对连续语流的基频曲线进行分解,提取了各个音节的高低音线,然后据此对理论推导的基频模型的参数通过相应的优化方法进行估计,得到量化的基频模型.为了消除音节拼接处的基频间断,本文又从正演的角度,在韵律块的基频曲线中融入发音速度、重音强度和发音实体等语境因素以及发音的限制性要素,实现韵律块基频曲线的整体优化.这种对基频曲线的正演和反演在很大程度上也解决了以前只能从感性认识的角度把握高低音线等抽象韵律参数的缺陷,为韵律模型的进一步完善提供了新的方法.
其他文献
本论文提出了一种新的脱机手写汉字识别方法。该方法是一种基于二维Markov模型(2DHMM)和EM算法的统计学识别方法。所提出的2DHMM是一种全向连接的HMM模型(Markov随机场),并且
多拉菌素(doramectin)是阿维菌素(avermectin)第三代衍生物,由阿维链霉菌(Streptomyces avermitilis)的α-酮酸脱氢酶(BCDH)阻断突变株经突变生物合成获得,化学本质为一种大环
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
多环芳烃(polycyclic aromatic hydrocarbons,PAHs)是一类由两个或两个以上苯环以线形、角状或簇聚的方式排列而成的烃类化合物,多来源于石油生产、化石燃料的燃烧、煤炭加工等。由于其具有诱变性、致癌性和生物累积性等特点,能通过食物链传递、迁移并在动、植物体内逐级富集,因此对人类健康和生态环境具有很大危害性。相较于PAHs的有氧降解,其厌氧条件下的降解速率不高。然而,在一
学位
随着云计算、大数据等新技术的发展,人们对数据流量的需求呈现出井喷式增长,这对骨干网的传输性能提出了更高的要求。.光传输系统由于其大容量、高速率、长距离传输成为下一
无线分组网络中的服务质量(Quality of Service,QoS)保证,是其提供多媒体业务实时传输的核心与关键之一,是3G和4G移动通信系统发展中的瓶颈.该领域的研究国际上近几年才开始,
逆合成孔径雷达(Inverse synthetic aperture radar,ISAR)是一种高分辨率成像雷达。它利用宽带信号获取距离向的高分辨,利用目标相对雷达转动产生的多普勒频率获取方位向的高分
在我国市场经济体制建设不断推进的背景下,企业通过债务进行融资已经成为了现代企业融资的主要途径.而企业社会责任信息披露的完整性、真实性等会对企业在市场中债务融资能力
差分跳频技术是近年来提出的通信新技术,它具有出色的抗干扰性、抗衰落性、可靠性、保密性,正逐渐成为军事通信领域的焦点。由于差分跳频图案基于有向图的遍历,使得频率的跳
本文通过对荣华二采区10
期刊