汉语TTS系统中的文本分析及韵律研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:daocaoren666666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文语转换(TTS)是将文字信息按语音处理规则转换成声音信号输出的技术。它可以使计算机流利地读出文字信息,使人们通过听就可以明白信息的内容。本文着重研究了汉语TTS技术中的文本自动分词,韵律标记以及韵律结构预测三个方面。TTS系统通常由文本分析、韵律控制和语音合成三部分组成。文本分析模块在文语转换系统中起着重要的作用,主要模拟人对自然语言的理解过程,使计算机对输入的文本能完全理解并给出后两部分所需的各种发音提示。其中,分词、注音和词性标注是文本分析最为初始的重要组成部分,也是语言模型需要解决的问题。中文自动分词由于歧义切分,未登录词识别等难点的存在,成为文语转换系统亟需解决的主要问题。N元语法是基于统计的分词算法,相对于其他分词算法,其在歧义切分方面的表现更好,但是它的一些不足也成为它继续发展的瓶颈。本文提出一种在传统的N元语法上结合最大匹配预处理,加入词性消歧并平滑的改进策略,实验证明提高了分词的准确率和召回率。韵律处理为合成语音规划出超音段特征,如音高、音长和音强等,使合成语音能正确表达语意,听起来更加自然。文本分词的结果是语法词,但是语法词并不能等同于韵律词,还需要一个韵律处理的过程。语调、节奏和重音这些韵律特征是通过超音段特征的变化表现出来的,因此,这些超音段特征的修改成为韵律控制的基础。本文在XML的基础上提出了一种汉语韵律标记语言,使韵律分析的结果自动标注上这些韵律标记,经过后续处理并最终合成出高自然度的语音。了解和掌握韵律单元的各种边界特征,正确地界定韵律层级边界,把韵律单元从话语中正确切分出来,进而认识话语的韵律结构,是话语表述和话语理解的基础。本文的最后实验分析了韵律层级边界的声学特征,通过引入CART树模型并加入关键结构助词的叶子评估问题达到了提高韵律短语预测精度的效果,从而实现文本处理和韵律处理的融合。
其他文献
网络技术的发展为嵌入式系统提供了一个新的研究领域,如何更好地利用丰富的网络资源仍然是嵌入式系统的应用热点。嵌入式系统与TCP/IP协议栈的结合是嵌入式系统网络接入的基
嵌入式系统从产生到现在已有三十多年的历史,近年来随着半导体技术的飞速发展,嵌入式处理器的性能也越来越强大,嵌入式处理器在应用数量上远远超过了各种通用计算机处理器。
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
随着全球快速城市化,人类活动已经强烈改变营养元素氮素的生物地球化学循环过程。对于人类主导的异养型城市生态系统,其消耗氮素的同时,直接或间接导致含有大量人为活性氮原子的
实现复杂电大尺寸目标电磁散射的快速高效求解对于雷达系统设计与雷达目标识别具有十分重要的意义。采用物理光学(PO)方法及其混合技术是分析这类复杂电大问题的有效途径。本
摘要:语文阅读是中学语文教学中的一个重要环节,研究阅读教学的模式,使学生认识语文阅读的规律,不仅可以让学生更容易地掌握所学内容,也可以让学生学会怎样进行有效阅读,更为重要的是让教师学会怎样更有效地进行阅读教学。  关键词:语文阅读;规律;模式;效率  中图分类号:G633.33 文献标识码:A 文章编号:1992-7711(2016)04-0004  每次模拟考试之后,同事们对语文现代文阅读的失分
本文的研究内容围绕MEMS器件优化方法与技术展开,开展优化系统结构的研究、典型MEMS器件优化方法的研究、参数优化算法的研究,编制相关软件,形成较为完整的MEMS器件设计与参数优
本研究综合运用遥感技术与实地样方采样相结合的方法,评估了城市森林降温服务功能、固碳、释氧功能以及林冠截留功能,并计算得到城市森林生态服务多功能指数。此外,本研究构
行为灵活性是指在面对新的和未预料的结果时灵活改变行为策略的能力。它对动物在一个动态环境中的生存繁衍来说至关重要。前额叶损伤和很多神经精神疾病的一个共同重要特征是
电阻抗断层成像(简称EIT)是近二十多年发展起来的一种新的医学成像技术。该技术充分利用人体阻抗所携带的丰富的生理和病理信息实现功能成像。通过在人体表面放置电极并施加