多语种语音合成中的关键技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:wjln123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多语种的语音合成研究是近期国内外语音合成研究的一个热点.在语音合成所涉及的一系列关键技术中,如何尽量避免使用语种相关的研究方法,是多语种语音合成研究中的一个重点和难点.该文以完成一个具有实用化水平的中英文合成系统为目标,对多语种语音合成所涉及的一系列关键技术进行了深入研究.韵律预测是语音合成中最重要的部分,它主要是指通过从文本分析中得到的信息,来预测这段文本的基频、时长、能量等超音段特征参数.超音段特征(尤其是基频参数)对合成语音的自然度影响非常大.该文提出了一种基于诀策树和贝叶斯分类器的组合预测模型.首先将所有的基频样本分成不同类别、并通过每个基频样本的韵律环境参数建立基频决策树模型.然后以韵律环境参数作为决策树模型的输入,判诀每个音节所对应的一组可能的基频类别和相应的概率;另外,根据对自然语音中相邻音节基频连接特性的分析,抽取出一种可以描述相邻音节的基频连接状态的概率.最后通过一个组合模型,将决策树产生的基频类别及其相应的概率与描述基频连接状态的概率联系起来,共同决策输入文本中每个音节的基频.和传统的基频预测模型不同的是,这种组合基频预测模型不是分别孤立的去分析单独音节的基频,而是以一个独立的韵律单位(如韵律短语)为分析对象,使得最终预测的基频具有更高的精确性和可信度.
其他文献
针对神经内科患者长期留置胃管反复出现消化道出血现象,2007-10/2008-03我们对50例留置胃管时间在10 d以上的患者,采取护理干预后取得满意效果,现报告如下.
随着Internet技术和家庭网络迅速普及,网络中的终端设备也越来越多,典型的例如网关、路由器和机顶盒等。传统的设备管理思想是采取一对一的人工上门服务方式,这种方式不仅效率低
我科2004-06/2008-01收治前列腺肥大合并糖尿病患者69例,并成功实施经尿道前列腺汽化电切手术治疗.现将围手术期的护理体会报告如下.
该文主要从统计模式识别的角度出发,来研究人脸图像的特征提取问题.它可以分为4部分:基于统计表征的特征提取;基于统计辨别的特征提取;非线性特征提取;变换域特征提取.论文的
2002-01/2008-01我们对80例女性尿道综合征的患者实行舒适护理,取得了满意效果,现报道如下.rn1 临床资料rn1.1 一般资料本组病程0.5~31 a,平均7.3 a.年龄17~68岁.未婚12例,已婚
随着局域网安全技术的发展和企业规模的不断扩大,更多的企业希望通过公共网络来组建虚拟专用网络,实现分布在不同地理位置的多个分支机构的互连。当企业的组网规模达到10万级别
无线定位技术是通过测量无线电波的参数,根据特定的算法来判断被测物体的位置。它包括红外、超声波、蓝牙、射频识别、超宽带、Wi-Fi、Zigbee等,最初是为了满足远航导航等需
对我院大批地震伤员术中感染控制的管理总结如下.rn1 临床资料rn1.1 一般资料我院2008-05-12/2008-06-07共为地震伤员实施手术372例486台次,其中男196例,女176例;年龄最大91
Internet的飞速发展,带来的是对人们思考和分析事物方式的巨大变革.呈现在人们面前的,是一个空前复杂的环境.从千变万化的表象中提取稳定的本质,并且把它抽象成一定的数学模
该文在速率检测的基础上提出了一种新的调整策略TITD(Testing Increase and Testing Decrease).当网络拥塞时,速率直接调整到当前检测到的速率;当网络空闲时,速率调整的增幅