基音与共振峰相结合的情感语音合成技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:fengyun163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号是人们构成思想疏通和感情交流的最主要的途径。传统的语音处理系统大多只着眼于语音词汇传达的准确性,而忽略了包含在语音信号中的情感信息。让计算机能够像人一样说出富有情感色彩的语音,就是人们长期追求的目标。因此,本文对情感语音合成技术进行了研究。   本文首先介绍了语音合成的研究意义、发展历程以及现有的主要技术,并分析了目前流行的情感语音理论,考察了主要情感分类方法,选取中性、喜、怒、惊、悲五种情感状态进行研究,从这五种情感语音中提取主要韵律特征,进行特征选择,发现了基音和共振峰特征的重要性。然后在中性语音的基础上,针对不同的情感状态,选用时域基音同步叠加技术(TD-PSOLA)对基频轨迹进行调整,对共振峰做相应的修改,最终与自然语音进行波形拼接,合成情感语音。在研究中取得了以下成果:   (1)在研究哪些特征在情感语音表达起重要作用的过程中发现了基音和共振峰的重要性,并结合这两类特征,修改韵律参数,拼接合成情感语音,并通过实验,证明了合成语音具有更好的情感真实度。   (2)对汉语语音协同发音现象进行研究,提出通过对语音过渡段共振峰的修改和基频轨迹的调整,来合成协同发音段,使不同的单字间在表达不同情感时具有不同的平滑过渡段。实验结果表明,合成的情感语音比未考虑协同发音现象时,自然度更高。   (3)设计了一个情感语音合成实验系统(Emotion converter)。该系统将采集到的中性语音,通过提取基音、共振峰以及能量特征,按照不同的情感状态依据情感规则分别进行修改,从而转换为带有其他情感的语音。
其他文献
近年来,车载设备作为监测列车运行状态的重要组成部分,其健康运行受到人们的广泛关注。目前关于车载设备的研究大多是基于车载设备采集系统对列车上空调系统、受电弓、车钩及
随着生物信息学的发展,生物医学数据呈爆炸式的增长,目前已经拥有数百个活动的生物医学数据库,如何管理和分析这些海量的数据已成为研究的重点。数据挖掘技术用于发现大量数据所
室内电波预测由于不同室内环境的复杂性而出现了较多的预测模型。电磁波传播理论与数值分析方法为基础的确定性射线跟踪模型,依靠现有的计算机技术能够较好的预测电波数据。射
随着计算机技术的飞速发展和生活水平的提高,人们在许多领域对信息安全要求越来越高,例如用计算机对小区进行智能监控,不仅节约人力资源和成本,也为日后案件的调查提供证据。
蛋白质折叠结构预测问题是当前生物学研究的一个热点。由于其特殊的结构和所使用的模型限制,利用NP问题的求解来求其最小能量值从而推测出折叠结构是这个问题的研究方向之一。
随着计算机网络在各个领域中的广泛应用,产生了庞大的网络信息,其中,以手机短信、QQ聊天记录、博客评论、新闻评论等短文本形式存在的信息也得到了空前的膨胀,如何对这些以短文本
近年来,越来越多的以短文本(通常文本长度小于160字符)形式存在的信息逐渐成为了人们获取消息的主要途径之一,如:微信,微博,网络评论,网络聊天以及搜索引擎返回的网络片段等等。所以
Internet技术和无线通信技术已经成为目前世界科学技术发展中最为活跃的领域之一。人们对移动性和信息的需求也在急剧上升。越来越多的人希望移动过程中不用更改计算机配置就
在互联网高速发展的今天,推荐系统能够缓解用户筛选感兴趣内容时的困扰,帮助用户发现有价值信息,已成为解决信息过载的有效手段。推荐系统中的协同过滤算法,因其领域无关性及
据2013年互联网数据中心报告显示,预计到2020年全球的数据总量将超过40ZB,这一数据量是2011年的22倍,如何从海量数据中快速抽取出用户所需要的信息是一个重要的研究课题。关