基于HMM情感语音合成的研究与实现

来源 :太原理工大学 | 被引量 : 5次 | 上传用户:gankai0319
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音合成技术的不断发展,机器所合成的语音越来越接近于人类的真实语音。为了使合成语音更加人性化,更好的被人耳所接受,人们开始希望它能够富含某种情感因素。由此,情感语音合成作为语音合成领域的一个新的研究方向被提了出来,并得到了快速发展。本文首先介绍了语音合成技术的研究现状和所需解决的技术难题。然后,对目前存在的几种语音合成的基本方法做了对比分析。基于隐马尔科夫模型(HMM)合成法与其他语音合成方法相比具有很多便捷之处。首先,HMM语音合成法能通过不断训练自动构建出一个新系统,而且所需时间较短;其次,在构建新系统的过程中不需要人工操作;最后,其训练过程与音质、音色及情感种类的关联较小。因此,本文最终选择该合成法来实现情感语音的合成。本文还对目前存在的几种情感理论做了介绍和分析,包括基础情感论、二维情感空间理论和情感轮等。本文选择基础情感论做为理论依据,选取了平静、高兴、悲伤和生气四种基本情感作为要合成的目标情感。本文通过对目前国内外现有的语音库进行分析,在确定语音语料、录制环境、情感种类等基础上,录制了一个适用于本文研究内容的情感语料库。本文对所录制的每种情感的语音各自所具有的声学特征参数做了分析,并得出其变化规律。最终,本文设计出一个合成系统来合成情感语音。该系统包含三大部分:基于HMM语音合成模块、情感分析模块和参数修改模块。本文还通过具体实验证实了该系统确实合理有效、切实可行。另外,本文还对基频抖动参数在语音合成中的实际应用做了分析。通过具体实验对原始合成系统所合成的情感语音和添加基频抖动后所合成的情感语音的听觉效果进行了对比分析。对比结果显示考虑基频抖动因素所合成的情感语音更加自然流畅,因此,说明了基频抖动参数在语音处理领域具有一定的研究意义。
其他文献
基于局部不变特征的匹配方法是近年来图像处理研究的一个热点,被广泛的应用于各个领域,本文将局部不变特征方法应用于遥感领域,主要研究遥感图像的匹配算法。遥感图像包括同源遥感图像与异源遥感图像,它们的匹配方法都有着各自的研究难点。同源遥感图像匹配的难点主要是实现算法的实时性,而异源遥感图像主要问题是解决图像间的非线性灰度差异,基于以上问题,本文分别提出了以下的算法。为了解决遥感图像匹配的实时性问题,目前
随着云计算、大数据以及各种新兴互联网业务的快速发展,传统网络架构逐渐不能满足人们的需求。软件定义网络(Software Defined Networking,SDN)作为一种新型网络架构受到了广
随着科学技术水平的不断发展与应用,工业流水线自动化程度加强。目前,在现代包装、印刷行业中,软包装(如塑料印刷、分切机、涂布机、印染等)生产线基本实现自动化。然而带材
实际的通信过程中,语音常常会受到周围环境噪声的干扰,进而影响语音信号的传输质量,而语音信号质量的降低会进一步影响后续信号处理系统的性能,甚至造成更严重的后果。因此,就需要
近年来,随着经济和信息的迅速发展,人们的生活越来越多的被电子、电气和通信设备等包围,但人们在感受设备的方便快捷时,也承受着这些设备所带来的电磁辐射及其对健康的影响,
随着信息技术的飞速发展,视频在我们学习、工作、生活中的地位逐步提升,并且必将成为不可或缺的一部分。由系统、视频、音频、数字版权管理等四个主要技术标准和符合性测试等
高速铁路的通信系统分为用于列车调度控制的专用无线通信系统和用于列车上乘客接入互联网的宽带无线通信系统。目前用于铁路调度控制的无线通信系统绝大多数采用的还是GSM-R
动力传送带、空中缆绳、磁带、纸带等多种工程元件,均可模型化为轴向运动物体。这些工程元件广泛应用于国民经济的各个领域,它们在运动时产生的横向振动在应用中可能有负面效果,会影响到系统的性能,从而限制其应用。引起横向振动的主要原因之一是由于轴向运动速度波动而引起的参激振动,特别是在驱动电机高速运行时。因此研究轴向运动物体因速度波动而产生的参激不稳定性及其控制方法具有一定理论和工程价值。本论文的内容主要有
随着全球经济的发展以及物联网技术的逐步成熟,市场对低价位、高性能的射频识别(RFID)标签的需求量急速上升。与当前商用RFID标签相比,无芯标签在功耗、单片价格和数据安全等方
随着信息技术的不断发展,稳像技术的研究在诸多领域都得到广泛的关注。电子稳像是继机械稳像和光学稳像后的新一代稳像技术,它通过使用电子设备和图像处理技术来稳定抖动的视