基于HTK的个性化语音合成研究与实现

被引量 : 9次 | 上传用户:lulswhzx512
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音技术的不断进步,语音合成技术也有了非常显著的提高。语音合成的效果有了很大的改善,语音的可懂度和自然度也基本能够满足了人们的需求。然而用户对现有的语音合成系统也提出了更高的要求,尤其是对于个性化语音合成方面的需求。在这种背景下,个性化语音合成技术就具有了很高的理论研究和使用价值。本文首先分析了不同语音产生的机理并对影响语音个性化的特征参数进行了详细的实验研究;并搭建了基于HTK(HMM-Tool-Kit)平台的英文语音合成系统,该语音合成系统的设计主要包含了语音库数据的预处理、基频参数和梅尔倒谱参数的隐马尔可夫模型(HMM)训练以及参数语音合成三部分;最后在该系统合成出来的语音基础上进行个性化特征参数调整,完成了个性化语音的合成。本文的主要研究内容如下:(1)在分析语音合成原理以及当前常用语音合成算法的基础上,选取了基于HMM可训练语音合成算法来进行语音合成;设计了基于HTK的个性化语音合成系统框架,分析了个性化语音合成的难点以及本文研究的重点。(2)从语音产生的机理分析了语音个性化产生的原因,以及不同语音参数对语音个性化产生的影响,在此基础上选取了对语音个性化影响较大的四个特征参数(时长、基频、能量、共振峰)分别进行了实验分析,得出各个参数的调整和变化对语音个性化产生的具体影响。(3)在HTK语音合成系统设计当中,完成了语音合成的预处理工作,包括语料库的选取、语音库标注以及语音参数的提取;在模型训练过程中,解决了英文的上下文相关语法设计、问题集的设计以及基于决策树的模型聚类问题,并完成了合成系统的HMM训练;在语音合成阶段,完成了待合成语句的文本分析以及文本标注;最后在Unix环境下完成了基于HTK平台的英文语音合成。(4)使用Praat软件对合成语音以及目标语音的四个主要个性化特征参数进行提取与分析,对比二者之间的差别。在此基础上,对合成语音的个性化特征参数进行调整和修改,合成出具有个性化特征的语音,并对个性化语音进行测评。本文采用的个性化语音合成方法增强了合成语音的个性化特征。
其他文献
对日语声调的研究往往多限于自立语.而作为附属语的助动词则只能附属在其他词语后,或增添某种意义或表示说话者的某种判断.因此,有关自立语的声调的各种规则往往不适用于助动
目的 了解2010年江苏省肿瘤登记地区恶性肿瘤发病和死亡情况.方法 根据2010年江苏省27个肿瘤登记地区的发病和死亡资料,按城乡和性别分层统计和分析恶性肿瘤的发病与死亡情况
知识经济时代,全球文化产业的发展十分迅猛,文化产业特别是具有丰富文化内涵的核心文化产业已经成为很多国家新的经济增长点,特别是广播电视产业的发展,其中最瞩目的当属韩国
随着时代变迁与经济全球化的步伐加快,时尚产业的发展已经是世界产业发展的一个新引擎,时尚生活型态的层次性也成为提升产业竞争力的一个至关重要因素,引起各方的关注。近年来在
爱国主义既是中华民族精神的核心和中华民族的优良传统,也是思想政治教育的核心内容。进入21世纪,经济全球化日益加快,网络技术日新月异,深刻影响到当代大学生的思维方式和行为方
<正> 德累斯顿埃尔斯纳PAC天竺葵种苗公司于1889年10月1日成立,至今已有110多年的历史。 最初,公司经营玫瑰、蔬菜和土豆。1926年起,开始种植阳台和花坛花卉种苗。1972年起,
不患寡而患不均,长期以来,收入分配一直是老百姓最关心的问题之一。本文立足居民收入差距逐年扩大的现实和党中央高度重视居民收入分配的背景,详细研究我国税收调控居民收入分配
改善碳纳米管在聚合物基体中的分散性,进而发挥其拥有的优异的各方面的性能,是目前众多研究者关注的热点。而如何通过改性碳纳米管实现这个目标则是其中一个最重要的分支。本课
系统综述了湖泊湿地沉积物重金属污染的研究进展,介绍了湖泊湿地沉积物研究的主要内容、研究方法和沉积物重金属质量基准方面的研究进展,并指出了该领域研究的薄弱环节以及未
以煤炭为主的能源消费结构在今后一段时间里仍然占主导地位并且难以改变。燃煤成本占火力发电成本的70%以上,电煤的价格与供应对于发电集团的效益影响巨大。中国煤、电改革的