面向情感的语音合成系统

来源 :第一届中国情感计算及智能交互学术会议 | 被引量 : 0次 | 上传用户:kcb2639
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
情感语音合成是近几年语音合成的研究热点,现有的研究多以语音的韵律和声学特征为指导因素.在情感语音合成的研究中,必须解决如下三个核心问题:(1)如何确定情感状态和情感语音的声学特征参数?(2)如何建立情感状态与语音的声学特征的关联关系,建立情感声学参数的综合控制模型?(3)如何结合文本分析和场景因素建立情感的预测机制?本文将围绕着这三个问题进行深入的探讨,在实验分析的基础上,对情感语音合成中需要处理的情感特征,以及情感特征的相互关系问题进行分析,并针对这些关联关系提出了情感声学模型和情感的韵律建模的思路,初步实现了一个情感语音合成系统的原型.
其他文献
为防止地震导致饱和松散至极度松散或淤泥质砂层的液化,可采取的措施为压实砂层使其空隙率降低(增加砂层的密度),或提高砂层的渗透性.在某些情况下,压实方法不是一个合适的方
本文首先对我国的土地沙漠化问题和全球的空气污染问题作了一个概况分析,列出很有说服力的数字;接着探讨了经编三维植被网产品开发的意义和前景;然后介绍了经编三维植被网产
本文阐述了国际对纺织品的新要求,分析了我国针织染整加工与国外发达国家的差距,提出了入世后我国针织染整加工迎接挑战所应采取的措施.
在自动化程度日益增强与个人意识不断觉醒的今天,设计与艺术的边界被消解,设计呈现出更多的艺术化特征,追求更趋于精神化的价值取向。作为一门与艺术紧密相连的交叉性学科,环
作为可信计算平台上信息存储的载体,硬盘的存储安全问题直接关系着系统的安全性、可靠性和机密性,为此引入了可信存储(TS)的概念,通过对实践过程中若干种安全场景的分析,提出了TS
针对Brandt密封电子拍卖方案计算量大的缺点,利用ElGamal加密体制和知识的零知识证明给出了拍卖协议的一个新的实现。新协议的安全性只基于计算离散对数的困难性,不依赖拍卖机
讨论了旋转对称(RotS)函数的Walsh谱特征,得到了RotS函数的一个等价判别条件。进而研究了RotS函数满足相关免疫性(CI)时的取值特征。给出了满足CI的Rots函数的一种构造方法,得
对在设计基于混沌的加密算法时应该注意的问题进行了分析。然后,在分析时空混沌模型的基础上,提出了一种分组加密算法。算法采用时空混沌的初始状态值作为密钥,以明文分组微调状
水印的不可感知性是评价水印算法性能优劣的重要指标之一,传统图像质量评价模型PSNR不能很好地评价水印化图像的质量。图像中不同的背景亮度、纹理以及频率对人类视觉具有不同
一般情况下,面部表情常常伴随着语音的变化同步进行,传统的情感表达,多侧重于单一的情感语音合成或人脸表情生成领域,缺乏一定的真实感.为达到更为生动的情感表达效果,本文在