统计参数语音合成中的频谱建模及生成方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:cjp023
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音信号统计建模方法的日益成熟和计算机处理能力的不断进步,近年来统计参数语音合成(Statistical Parametric Speech Synthesis)技术发展迅速。其中,基于隐马尔科夫模型(Hidden Markov Model, HMM)的参数语音合成因其具有合成语音流畅度好、系统构建自动化程度高、系统尺寸小等优点,已成为现今主流语音合成方法之一。然而,该方法存在合成语音音质受损、自然度不高的问题。频谱特征声学模型的精度不足和参数生成过程中的过平滑效应是造成合成语音音质受损的主要原因。因此,本文围绕基于HMM的统计参数语音合成中的频谱建模和参数生成方法展开研究工作。首先,本文研究结合对数功率谱全局方差(Log Power Spectrum Global Variance, LPS-GV)的最小生成误差(Minimum Generation Error, MGE)模型训练方法,以实现不增加合成端运算量的前提下合成语音自然度提升;其次,本文研究基于受限玻尔兹曼机(Restricted Boltzmann Machine, RBM)的频谱状态建模与参数生成方法,以改善原有方法参数生成阶段使用高斯近似带来的模型精度损失问题;最后,本文研究结合RBM建模与GV参数生成的频谱特征预测方法,通过组合两者的技术优势,进一步提升合成语音的自然度。整篇文章的结构安排如下:第一章是绪论,其中简单介绍了基于HMM统计参数语音合成方法的基本原理,回顾了其发展历史以及技术现状。第二章介绍了一种针对线谱对(Line Spectral Pairs, LSP)参数的频谱模型训练方法。该方法使用结合LPS-GV的MGE模型训练准则,避免了原有LPS-GV参数生成方法运算复杂度过高的问题,在不增加合成端运算量的前提下,提高了传统MGE训练方法合成语音的自然度。第三章主要研究基于受限玻尔兹曼机(RBM)的频谱状态建模与参数生成方法。首先,本文设计并实现了一种基于Gibbs采样的高斯近似均值估计方法,该方法可以取得与原有的基于梯度下降的高斯近似方法相近的合成语音性能。然后,本文提出了一种结合动态参数约束的RBM-HMM参数生成方法,该方法相对高斯近似参数生成方法可以取得更高的合成语音自然度。第四章主要研究结合RBM建模与GV参数生成的频谱特征预测方法,以综合RBM建模精度高和GV参数生成方法可改善过平滑效应的技术优势。本文设计实现了两种不同的结合RBM建模与GV参数生成的方式。实验结果表明,相对使用单一技术,两者结合后可以进一步提升合成语音的自然度。第五章将对全文进行总结。
其他文献
在欧洲粒子物理研究所(CERN)的大型离子对撞实验(ALICE)中,光子探测系统(PHOS)需要大量的数据采集板采集高速粒子碰撞时产生的信号。为了保证批量生产的数据采集板在PHOS系统
摘要:随着我国科学技术的不断创新,国民经济水平的不断提升,我国的建筑工程业也得到了迅猛发展。各种施工技术手段不断创新,加固处理这一技术手段在整个建筑施工过程中扮演着十分重要的角色,它对提高工程质量起着决定性的作用。通过本文对建筑施工中加固处理技术的分析和阐述,分别介绍了混凝土、碳纤维等建筑工程的加固技术,以便让大家对加固处理相关技术有一个新的认识。    关键词:加固技术具体方法    前言:建筑
期刊
赤潮给海洋环境、海洋渔业和海水养殖造成严重危害,给世界经济带来了无法估量的损失,而且威胁人类的生存。研究赤潮探测方法具有至关重要的意义。  传统的船载和海洋浮标监
近年来,由于互联网的广泛普及和多媒体技术的飞速发展,基于网络的视频流式传输技术得到了广泛的应用,如视频监控、视频点播、网络直播、远程教育等。作为我国具备自主知识产
为了克服传统微波辐射计的局限性,提高微波辐射计的空间分辨率,出现了综合孔径微波辐射计。另一方面,在图像处理领域,超分辨率技术为提高图像的空间分辨率起到了很好的效果,
潜艇是现代化强国军事力量的重要组成部分。潜艇与基地的通信联系是关系到潜艇能否发挥作用的重要问题。在现代战争条件下,为充分发挥水下潜艇的作战威力,对它进行及时有效的
摘要:电磁辐射对人体具有不同程度的危害,本文阐述了电磁辐射的防护技术、设备和措施。  关键词:电磁辐射防护技术措施   电磁辐射又称电子烟雾,是一种复合的电磁波,以相互垂直的电场和磁场随时间的变化而传递能量。人体生命活动包含一系列的生物电活动,这些生物电对环境的电磁波非常敏感,因此,电磁辐射可以对人体造成影响和损害,如头晕、失眠、健忘等,严重者甚至导致心血管疾病、糖尿病、癌突变等,同时,还会影响通
期刊
随着个人数据通信的普及,人们已不满足有线的接入Internet,宽带无线接入成为未来通信的发展趋势。CNGI移动终端的开发是宽带无线接入的重要组成部分,而MAC数据服务功能又是CN
由于Flash存储芯片具有功耗低,容量大,访问速度高,无机械故障,数据非易失,并且不需要特殊的高电压即可实现系统电擦除和重复编程等优点,成为移动存储卡的主要存储介质。近年
近年来,随着人们对于无线通信无缝覆盖和高传输速率要求的不断提高,数字微波通信的研究与应用也受到了广泛的关注。而数字下变频技术在数字微波通信接收机的设计中,有着极其