基于HMM的中文情感语音合成的研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:kabasiji2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人类最直接、最有效的交流方式。随着计算机智能和情感计算的发展,人们对语音处理技术的要求越来越高。本文针对多样化的语音,提出了基于HMM的语音合成方法,实现了系统的自动训练与构建。在此基础上,研究了语音的情感分类方法以及情感语音的特征分析,通过分析情感语音在基频、时长、能量和上下文等方面的特征,总结出情感语音和中性语句之间的关联。为了合成出高质量的情感语句,特别引入了PAD三维情感模型,将离散化的情感语音扩展为可计算的量化语音。最后,通过语音合成器合成目标情感语音。本文采用PAD情感状态模型分析语音的情感特征,这为今后语音的情感处理研究提供了理论依据。通过Boosting-GMM算法来预测建模,为后续的目标情感语音合成奠定了良好的实验基础和分析依据。本文主要研究工作和研究成果如下:1.提出一种基于统计声学模型的语音合成方法,建立了一个完整的可训练的语音合成系统框架。该系统对输入的语音数据进行声学参数建模,并以训练得到的统计模型为基础构建相应的合成系统,能够很好地满足目前对多样化和高表现力的语音合成需求。2.采用了PAD情感状态模型对情感语音特征参数进行了定量分析,得出不同情感状态与PAD三个维度之间的映射关系,为后续的目标情感语音合成提供了理论基础,提高了合成语音的音质。3.通过Boosting-GMM算法进行情感预测建模。针对实验中的四种目标情感,建立四种弱预测模型。每个弱预测模型由一种基本的预测模型和其它辅助预测模型组成。实验对比了基于GMM和基于Boosting-GMM的特征预测模型的效果。由于Boosting-GMM实现了重新采样的过程,在训练集中增大了包含大预测误差的样本比例,所以基于Boosting-GMM算法对于GMM算法的预测模型有更高的预测准确率。最后通过预测模型得到的参数和STRAIGHT算法合成出目标情感语音。实验表明,通过该方法合成的情感语音具有较好的音质和自然度。
其他文献
中央教科所博士后于泽元等人在《课程·教材·教法》2008年第4期中撰文提出,教师专业发展中的反省可按五个层级进行:①外在行为:有关行为是否有效的反思;②内在观念:有关
安史之乱后的中唐,逆建唐以来逐渐流行的女性袒胸之风,而出现了一种专遮胸乳的女性内衣,名为诃子。服饰上的变化,实际上成为了"礼"与"非礼"的体现,这与安史乱后唐廷边疆危机
课外作业是课堂教学的补充和延续,作业质量关系到教学质量,关系到学生创新精神和实践能力的培养。所以,作业的设计要讲究策略,要符合一定的原则,以中学数学课外作业的设计来说,应关注以下几个方面。    一、课外作业设计的科学性    美国华盛顿大学的阿密泰·埃西奥内教授提出,课外作业的目标不在于使学生接受大量的信息,而主要是培养注意力的集中,遵循作业的规范,敢于面对困难并克服它,发展学生的思维以及抵御各
中等职业教育的特定性,决定了其学生思想素养和文化知识水平的特殊性,这对中职班主任工作提出了挑战。本文提出做好中职学校班主任工作的方法。
私有档案是国家档案资源的重要组成部分,其中对国家和社会具有保存价值的已纳入法定的国家管理范围。随着社会主义市场经济体制的逐步建立,私有档案呈现出快速增长之势,其本
摘要 课程考试与评价是课程教学体系中的一个重要环节。本文在高职教育以服务社会,服务就业为目的背景下,结合影视多媒体技术专业课程的特征,建立以专业人才培养目标为价值取向的考试评价体系,以提高专业课程教学质量,为实现课程目标以及专业目标服务。  关键词 影视多媒体技术 专业课程 考试评价体系    一、专业课程考试评价体系建立的意义    影视多媒体技术专业是计算机多媒体技术与影视制作技术相结合的新兴
为使工程招标投标活动进一步体现公平和公正,在学习、研究了交通部修订颁布的《公路工程施工招标投标管理办法》的后,对“双信封评标法”在建筑工程招标中的应用做了一些有益的
随着信息技术的应用越来越广泛,外语教学逐渐突破封闭式教学模式的束缚,全面转变为开放式教学模式。该文将基于外语全新教学模式背景,探讨师生有效交流方式、形式及自学能力
【正】 帐务质量是会计核算工作的基础。要提高帐务质量,必须把住“三关”。一是把好审查凭证关。审查凭证是帐务核算的开始。银行在受理凭证时,要认真审查凭证的内容是否符
任何国家与民族要实现经济与社会的现代化,都必须发展教育事业以提高国民的科学素质和科学精神。同样,我国加速社会主义现代化进程,也要努力提高教育效率和教育质量。然而受到国