汉语文语转换中韵律模型的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:lonlinyang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对汉语文语转换系统中需要使用的时长和基频模型均进行了深入的研究。以一个包含4848个汉语句子的大规模语音库为基础,将几种机器学习算法应用于韵律模型时长和基频的生成中。本文分别将人工神经网络和决策树应用于时长模型的学习,并在建模的过程中使用了一些数理统计的方法。此外,本文还在时长的生成上试验了基于语料库的方法。基频模型方面,本文尝试了基于语料库的方法,并随后提出了一种基于基频模式的方法。为了区分两个模型的性能,本文采用了常用的MOS(Mean Opinion Score)评价方法,实验结果表明,基于基频模式的生成方法明显优于基于语料库的方法。最后,本文利用基本的统计学方法,在一个小规模的情感语音库(包含三种情感,每种情感310句)上对情感相关的韵律参数进行了统计分析,并对情感语音时长和基频均值的生成进行了深入地研究。在建模的过程中,我们成功地解决了数据稀疏导致的过拟合问题。
其他文献
随着分布式系统的广泛应用和面向对象技术的蓬勃发展,以分布式对象为基础的软件系统的应用越来越广泛。分布式对象作为此类系统的基本单元,对此类系统的设计、实现和运行起着
模糊决策是模糊集合论与决策理论相结合的产物,它为解决半结构化和非结构化的决策问题提供了完备的理论依据和方法模型。本文首先对现有的几类典型的模糊决策方法进行了深入
本文首先提出了一种改进的动态时间规整算法并用其来识别八类不同形状的脉象。该方法是基于模板匹配来对模式进行分类的,其优点是分类时无需特征提取,分类器的设计不需
在近20年来图像处理技术和计算机视觉技术变得越来越重要。图像分割又称为图像中物体的边界识别,是计算机视觉和图像处理中最为重要的问题之一。分割技术的应用范围很广,包括
  本文介绍了搜索引擎技术的历史、工作原理、新技术、专业领域数据库搜索引擎和面临的挑战,提出了页面分析与数据提取技术和主动式Web信息获取技术。使用Java以及Oracle9i
由于因特网和嵌入式系统在汽车、飞机以及其它安全系统的成功应用,未来将会更加依赖于计算机设备的功能。由于技术的快速发展,发展验证系统正确性的可靠方法变的越来越重要。目
本文绪论部分详细讲解了本论文课题的来源等背景知识、国内外的研究现状和论文的组织结构。第二章主要是讲述了编程基础知识技能。论述了与本系统设计相关的基础理论知识。如
本文首先讨论双序列比对和多序列比对的定义,介绍多序列比对的四种常用模型,分析其优缺点;然后分析和比较多序列比对的各类算法(精确算法、近似算法、启发式算法和并行算法等)
随着互联网以及电子商务的飞速发展,用户陷入了一种信息迷失的状态,面对海量的商品用户往往在找到感兴趣的商品之前已经非常沮丧、烦躁,因此很可能会放弃此次购物。解决该问题的
本文首先介绍了网格计算的相关概念,通过对国内外网格计算的发展与研究进行分析,展望了网格计算的未来研究方向,同时简要介绍了国内外在资源选择方面的研究现状。接着,阐