统计参数情感语音合成的研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:hxzhou618
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音合成技术的研究与发展,合成语音音质得到较大提升,但当前语音合成技术的研究仍以中性化语音为主,对情感语音合成的研究较少。人类生活对智能语音的需求不仅要涵盖基本的文字内容,还要承载丰富的情感信息,情感语音合成的研究将是智能语音研究领域的必然趋势。本文建立了一个多说话人的多种情感的情感语音语料库,针对汉语统计参数语音合成中的上下文相关标注生成,设计了一套包含6层上下文信息的标注格式,在此基础上,采用多说话人的情感语音数据和统计参数语音合成方法,利用说话人自适应训练算法训练了情感语音的声学模型,实现了情感语音的合成。论文的主要工作和创新如下:1.建立了一个多说话人的多种情感的语料库。在专业录音棚中,采用诱发方式激发录音人的情感,并进行录音。录制了7个男性说话人和7个女性说话人的11种典型情感的情感语音数据,并以Microsoft WAV格式(单通道、16bit、16kHz采样频率)进行保存。2.实现了一种面向普通话统计参数语音合成的标注生成算法。针对汉语统计参数语音合成中上下文相关标注的生成,设计了一套包含6层上下文相关信息的标注格式。以声韵母做为语音合成的合成基元,利用基于隐Markov模型(Hidden Markov Model,HMM)的统计参数语音合成方法,通过对合成语音音质的主、客观评测,验证了不同上下文信息对合成语音音质的影响。实验结果表明,本文设计的上下文相关的6层标注格式能够满足情感语音合成的需求。3.提出了一种利用多个说话人的多种情感训练语料,利用统计参数语音合成方法实现情感语音合成的方法。首先利用多个说话人的情感语音语料,通过说话人自适应训练(Speaker Adaptation Training,SAT)得到多个说话人情感语音的平均音模型,然后利用目标说话人的目标情感的训练语料,经过说话人自适应变换,得到目标说话人目标情感的声学模型,进而合成出目标说话人的目标情感语音。实验结果表明,本方法合成得到的情感语音具有较高的自然度和情感相似度。
其他文献
近年来,随着经济的快速发展,填石路基施工技术在公路施工过程中的应用特点,讨论了在公路施工中影响填石路基施工的主要因素,提出了填石路基施工在实际的工程应用中需要注意的
高速公路改扩建工程中对于组织安全管理和车辆分流工作主要围绕工程实际情况实施,对于提到工程整体效果十分重要.本文通过分析高速公路改扩建的特点,围绕路基施工、桥梁施工
单线铁路隧道由于断面较小,很多机械在洞内无法正常作业,因此进行合理的施工组织设计尤为重要,本文结合重庆合川双槐电厂二期工程铁路专用线3标芭蕉湾隧道进口工区的施工作业
随着城市用地日益紧张,城市建筑项目主要以高层建筑为主.滑模施工技术是高层建筑工程施工过程中常用技术,能够提高工程施工效率,也可以保障高层工程项目质量.目前,我国高层建
针对贵阳地铁2号三桥站~二桥站区间隧道侧穿川黔铁路二桥石拱中桥桥墩工程,通过有限元数值模拟计算方法,分析地铁区间隧道近距离侧穿既有铁路桥墩施工对地表、铁路桥墩影响.现
无线通信和导航技术的迅速发展对宽带接收机前端射频电路提出了越来越高的要求,混频器是接收机的核心模块,其性能直接影响整个系统的性能及系统对其他模块的功能要求。基于可
随着我国交通运输业的不断发展,铁路建设也迎来了蓬勃的发展机遇,铁路已经成为生产生活中必不可少的交通工具,有效地促进了社会经济的可持续发展.当前,铁路隧道施工的环境变
本研究旨在探索c-KIT基因及SCF基因在不同毛色山羊皮肤中的表达及与成熟黑素细胞数量关系,并筛选出与山羊毛色相关的c-KIT基因及其配体SCF基因的SNPs标记,以期对毛色性状的分子
框架剪力墙结构在高层建筑之中是有着广泛性运用,由于其安全性与稳定性相对其他结构类型存在着明显的优势,现今已变成建筑工程中普遍应用结构.随着社会不断的发展进步,高层建
我国棉花黄萎病主要是由大丽轮枝菌引起的土传维管束病害,严重影响着棉花的产量和纤维品质。本研究室前期构建了黄萎病诱导下陆地棉抗病品种差减文库,筛选出一系列与黄萎病抗性