基于可训练文语转换系统的韵律模型优化

来源 :南开大学 | 被引量 : 0次 | 上传用户:youare2b2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文语转换是人机交互技术的核心技术之一。尽管当前的文语转换系统可以合成出良好可懂度和自然度的声音。但是合成声音的自然度并不是让人满意,听起来平淡且节奏感不强。本文主要研究在基于HMM的文语转换系统中韵律模型的优化。   本文采用基于隐马尔可夫模型的文语转换技术搭建了中、英文语音合成系统。在此系统的基础上,本文针对韵律平淡和节奏感不强的问题进行了一下两方面的改进:一是改进时长模型,在产生时长的时候同时优化状态、音子和音节三层模型似然值,以弥补只考虑状态时长模型生成时长的不足;二是改进基频生成算法,传统的方法只考虑了状态级的基频模型,本文通过分析韵律的层次结构,提出了生成基频时同时优化状态、音节和音节段三层韵律模型的似然值,来提高生成基频的自然度。   本文通过实验对这两方面的改进进行了验证,实验结果表明:通过时长模型的改进,中英文时长的均方根误差分别提高了11%和5.6%;在中英文语料库上基频算法前后基频相关系数从0.70和0.91提高到了0.75到0.92;主观评测显示经过两方面的改进自然度也有较大的提高。
其他文献
随着应用软件的规模越来越大,软件系统的运行环境日益复杂,传统的软构件技术面临着新的挑战。本文针对目前软构件复用程度不高,无法适应动态可变的运行环境和用户需求的多样
随着人类社会的不断进步,快速便捷的身份检验受到越来越多各界人士的关注。人脸属于生物特征,作为人的本质特性,其稳定性和差异性非常强,因此可以当作检验身份的很好方法。同
云计算中的监控功能是获得系统准确详细信息的重要途径,也是云管理系统的重要组成部分。随着云计算系统的规模不断扩大,带来的管理复杂性问题日益凸显。论文针对云环境中的弹
随着多传感器数据融合技术的迅速发展,多传感器管理也应运而生。多传感器管理可以看作是这样一个过程:在一个动态、不确定的环境中,管理和协调多个传感器,以确保各传感器能够
网络技术在汽车上的应用,已经成为现代汽车电子技术发展的一个重要方向,其中,车载网络测试技术是汽车网络开发过程中的重点和难点。因为,一方面通过测试可以尽可能早地发现开发中
云计算作为一种新的计算模式,其发展日新月异,但同时也带来了高能耗问题。本文主要研究云计算环境下的能耗优化问题。针对云计算系统中产生高能耗的两个原因:一是大量服务器空
随着网络技术和多媒体技术的发展,远程实时课堂共享系统已逐步成为一个重要远程教育平台,该系统通过双向高质量的视音频交互和大屏幕显示技术,将实时课堂和远端的网络课堂和
一直以来,纹理的分析和应用是图像处理领域的一个非常重要的研究方向。纹理分析可以对纹理的性质做出定量的分析和描述,主要被应用于纹理分类、纹理分割以及纹理合成等方面。
随着Internet技术和信息化建设的发展,基于J2EE的多层Web应用能够快速构建一个分布式企业应用,而J2EE提供的Web层组件将页面显示、业务逻辑及数据处理都集中在页面代码中,导
随着计算机网络技术与多媒体技术的迅速发展,多媒体数字产品的传播变得异常快捷和方便,客观上导致了更多的作品侵权、信息篡改等问题。作为传统加密方法的有效补充手段,数字