基于统计声学建模的单元挑选语音合成方法研究

被引量 : 0次 | 上传用户:linqaz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自20世纪末以来,基于统计声学建模的语音合成技术发展迅速,因其具有系统构建自动化程度高、合成效果稳定等优点,逐渐成为语音合成领域的研究热点。其中,隐马尔可夫模型(Hidden Markov Model,HMM)是最为常用的声学统计模型形式。目前基于HMM的语音合成方法主要包含两大类,即基于HMM的参数语音合成和基于HMM的单元挑选语音合成。单元挑选语音合成方法按照待合成句的文本从预先录制好的音库中挑选合适的单元序列,然后拼接单元序列的波形得到合成最终的合成语音。在音库数据量充分的情况下,单元挑选合成方法相对参数合成方法具有合成语音音质高、自然度好的优势。本文研究基于HMM的单元挑选语音合成方法,针对现有方法在单元挑选准则中存在的两个不足进行改进。第一,在基于HMM的单元挑选合成方法中,训练阶段针对不同的声学特征进行相应的声学统计模型的训练,单元挑选阶段融合不同模型的似然值度量以设计单元挑选准则。在现有方法中,声学统计模型参数可以利用训练音库基于最大似然准则得到,但是单元挑选准则中用于融合不同声学统计模型的权值无法自动训练。考虑到模型权值向量的合理与否对最终合成语音自然度有着显著影响,本文提出了基于合成质量预测的模型权值优化方法,实现了对于模型权值的合理估计。第二,传统方法在进行基于HMM的频谱特征建模时往往使用协方差矩阵为对角阵的单高斯模型,该模型对于高维频谱特征的描述能力不足,因此传统方法通常采用低维且维间相关性较弱的梅尔倒谱作为频谱特征。而梅尔倒谱相对谱包络等高维频谱特征,存在频谱细节丢失的问题。因此本文提出了基于受限玻尔兹曼机的频谱建模与单元挑选语音合成方法,改进了单元挑选准则,提升了合成语音的自然度。整篇文章的安排如下:第1章是绪论,将介绍语音合成的基础知识,回顾语音合成的发展历史,并概述语音合成的常用方法以及当前研究热点。第2章介绍基于HMM的单元挑选语音合成方法,包括HMM的基本原理,系统构建流程以及涉及的关键技术等,分析该方法的优缺点并引出本文中后续研究工作的动机。第3章重点介绍基于合成质量预测的模型权值优化方法。该方法首先利用预设的权值组合收集较少的人工测听结果,然后采用多元自适应回归样条构建针对不同权值下合成语音质量的预测模型,最后基于该预测模型利用模式搜索算法自动搜索最优权值。实验结果表明该方法可以有效优化模型权值并改善合成语音的自然度。第4章重点介绍基于受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)的频谱建模与单元挑选语音合成方法。该方法在模型训练阶段,采用RBM对HMM各状态的频谱特征进行建模;在语音合成阶段,使用训练得到的RBM模型计算备选样本频谱特征的对数似然值,并通过分段线性映射构建单元挑选的目标代价函数。实验结果表明该方法可以有效的提高合成语音的自然度。此外,本章还实验分析了改进后的目标代价函数在单元挑选中的不同使用方法,以及基于RBM的拼接频谱特征建模方法。第5章将对全文进行总结。
其他文献
在由于万维网中的知识爆炸式增长,并随着万维网快速兴起,万维网上的海量数据都是以自然语言形式存储的,例如:网页微博、各种论坛、空间、贴吧等等存储介质上,所以,关于一些知识获取
目的:研究麻黄中生物碱类成分富集新方法并对其生物碱类成分进行分析,以期从中发现新的平喘活性成分。方法:为减少非生物碱类成分对定性分析的干扰、提高生物碱类成分分离制
儒学自其产生便具有超越现实、救世济民的理想性格,秦汉之后,儒学作为整个国家官员系统的精神信仰与价值理念得以奉行贯彻,成为真正意义上的经世致用之学,尤其是自国家实行科
媒体融合是世界级的革命性话题。千万年的人类传播史,实际上只经历了短距离点对点和长距离点对面的两大传播季,目前正进入全方位点对面上的点这一空前阶段。互联网和卫视群强
近两年来,种子行业在全国范围内遭遇高库存压力,年制种量大幅上升的背后是寻利资金大举进入投资回报率逐渐增高的种子行业,从而导致行业参与者之间利用产量增加进行恶性竞争。这
祁连山是中国西部重要生态安全屏障,是黄河流域重要水源地,是中国生物多样性保护优先区域。但祁连山也是一个生态极其脆弱的区域,生态系统易受自然条件的影响,承载力低、易破
社区教育工作者的整体素质不高、专业素养缺失已经成为制约社区教育深入发展的:瓶颈。从专业素养的角度出发,综合教育学、社会学等相关理论,以江苏省无锡市为例,有针对性地展开调
华语教学出版社(Sinolingua Press)是中国外文局(CIPG)所属的出版社之一,成立于1986年。从社名上看,成立出版社的目的就是出版中文教育图书的出版社,这是立社之本,华教社一直在这
目前,我国基层社区老年教育面临着发展的瓶颈。其原因主要有社区老年教育覆盖面窄、实际参与率低、资源匮乏、教育内容形式单一、资金投入不足、师资力量匮乏等因素。要加快
目的观察核心肌群训练配合姿势疗法在治疗腰椎间盘突出症的临床疗效。方法将68例腰椎间盘突出症患者随机分为治疗组34例和对照组34例。治疗组在综合治疗的基础上实施核心肌群