汉语语音合成中韵律预测技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:kitwe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语韵律预测是语音合成系统中必不可少的环节,它是生成静音、基频和时长等韵律参数的前提,其准确率很大程度上决定了合成语音的自然度甚至可懂度。本文的研究重点是如何提高韵律节奏和重音的预测准确率。在韵律节奏预测方面,本文首先统计和分析了语法特征和各级节奏单元分布之间的关系,然后将语法特征融合到节奏预测模型中进行了一系列尝试,证明了融入更多深层次的语法特征可以改善节奏预测模型性能。在上述实验基础上,本文对特征集合进行了优化,并通过实验证明新的特征集合可以进一步提高预测准确率。重音预测方面,本文重点研究了如何提高语篇环境下的重音预测准确率。针对语篇环境下的重音与单词信息量关系紧密但是难以统计量化的问题,提出了一种基于统计的单词信息量计算方法。通过实验证明,加入了包括单词信息量的全局特征可以改善重音预测模型的性能。具体来说,本文的主要工作包括以下几个方面:  1)探讨了如何利用更多深层次的语法特征改善汉语韵律节奏预测模型的性能。本文对大规模节奏标注语料库进行了统计和分析后发现,语法短语结构的浅层信息与低层节奏单元的对应关系比较明显;而依存关系的深层信息与高层节奏单元的关系更紧密。在随后的实验中,本文发现语法特征对韵律节奏预测模型的性能提高有帮助,但是仅依赖于语法特征的模型性能要差于仅依赖于传统的文本基础特征的模型性能。因此需要将文本基础特征和语法特征采用适当的组合方式才能提高韵律节奏预测模型的性能。对于各个韵律节奏单元而言,语调短语的预测模型在加入语法特征后提升明显,韵律短语和韵律词的预测模型则有小幅提高但不明显。同时,语调短语的预测优化更依赖于依存结构特征,而加入了语法短语结构特征以后反而会导致准确率下降。  2)验证了不同层级的韵律节奏单元预测更依赖于对应层级的语法特征。本文提出将语法特征按照层级划分为全局语法特征和局部语法特征。通过实验证明,加入全局语法特征以后的语调短语预测模型和加入局部语法特征的韵律词与韵律短语预测模型的性能均得到进一步的改善。  3)首先采用单句级别特征集合对语篇语料中的重音进行了预测实验。实验结果表明采用单句级别特征集合的重音预测模型对于高层级重音预测效果不佳。然后针对语篇环境下的高层级重音与单词信息量关系紧密但是难以统计量化的问题,提出了一种基于统计方法的单词信息量计算方法。通过实验证明,加入了包括单词信息量的全局特征可以改善语篇语料环境下的重音预测模型的整体性能。
其他文献
该文以挖泥船为研究对象,提出采用自控频率调速系统对泥泵的转速进行控制,并对此系统建立模型、进行工程设计,对系统的性能进行仿真,使系统具有较好的动态跟随性和抗干扰性.
基于光学测量方法的三维曲面轮廓测量技术,由于其具有非接触、高精度、易于自动控制等优点,日益受到人们的重视,广泛作用于机器视觉、三维造型、自动加工、工业检测及质量控
武器在现代战争中是非常重要的,是决定胜败的关键因素.ARM(Anti Radiaton-Missile)反辐射导弹作为现代武器的一种,其研制和发展越来越受到国内外有关研究人员的生视.该文详
该文首先对磁电式执行器的特性进行了研究,发现磁电式执行器具有严重的非线性和时变性.针对这样的特性,该文提出了Bang+bang+分段PI复合即将执行器的整个行程按其特性分段,分
精神分裂症是一种慢性的、严重的、功能障碍的脑疾病,至始至终都在影响着人类的健康。本文中,我们采用了一种联合分析手法:影像遗传学,将神经影像和遗传整合在一起,来研究精神分
该仿真系统详细分析了SPWM调制的原理,在此基础上,给出了SPWM序列的优化算法;通过对异步电动机的电磁原理的系统分析从而推导出了SPWM变频器--异步电动机调速系统的动态和动
该文在深入研究了灰色系统理论和方法的基础上,主要做了如下几方面的工作.传统的一些建模方法,只能建立离散的递推模型,不便对系统作全面的分析,更不能作长期预测,该文给出的
图像识别是计算机视觉领域的核心分支,它集成了数字图像处理、模式识别和机器学习等学科知识,是图像检索、图像标注、人机交互和智能视频监控等应用技术的基础。特征表达是图像
该文对具有超机动能力的先进战斗机对近距空战的影响进行了研究.为些,针对具有刚体特性的质点模型,该文进行了初步的飞行控制律的设计.具有全向攻击能力新武器的出现对飞机格
该论文采用光电法检测露点的原理,研制了智能式的光电露点仪,用于测量空气或其他气体的湿度.该露点仪主要由三部分组成:光电检测系统、半导体致冷系统和单片机测控系统.露点