基于数据挖掘的汉语韵律建模研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yilishabai123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体通信技术的不断发展,人们对信息获取的方式和内容提出了越来越高的要求.语声信息服务以其方便、直接的优点受到了通信领域的广泛青睐.作为人机语音通信的一个重要方面的语音合成技术是否可以达到实用的要求关键在于其自然度是不是和真人接近.而合成语音是否自然最主要的标志就是合成语音的韵律是不是和自然人说话时的韵律想吻合,这也是语音合成技术中最重要的核心技术之一.该文在汉语语音合成系统中需要使用的基频和时长模型均进行了深入研究.基频和时长是韵律特征中最重要的两个特征,该文利用基本的统计学方法和数据挖掘方法,对基于语音学规律的Target基频模型以及SoP时长模型中高层韵律描述和模型参数之间的关系,进行了详细的统计和分析.在分析过程中,分别解决了数据稀疏和属性间相互作用的问题;在数据挖掘方法上,利用了CART树和非线性回归方法的特点,训练过程中采用一系列的方法保证了数据挖掘效果.文本利用3500句左右的汉语自然语流建立了系统的基频模型和时长模型.并且在此基础上,完成了一个大语料库合成系统KB3.0.通过对系统的效果评测验证了韵律模型的良好效果.该文主要包括以下几方面的内容:(1)介绍了基本的统计学方法(均值比较,单因子方差分析,多元非线性回归)和数据挖掘方法(CART)的基本原理和技术特点.(2)介绍了Target基频模型的基本思想,在大语料库上生成Target模型参数作为训练集,通过CART树的方法训练出可以使用的Target基频模型.(3)介绍了SoP时长模型的基本思想,通过大量的统计分析工作确定了时长模型中各个属性的影响和其中的相互关系,对连续语流数据库建立了声韵母时长模型.(4)在Target基频模型和SoP时长模型的基础上,设计并实现了KB3.0大语料库语音合成系统,在韵律的普适性等方面具有显著的提高,整体效果达到了相当的水平.以KB3.0语音合成系统为核心所完成的InterPhonic语音平台产品和行业解决方案,已经在社会生活的众多领域得到了广泛的应用.语音技术作为一种沟通的技术,通过在韵律研究方面的不断进步,已经越来越多的应用到各行各业中去.
其他文献
目的:为降低护理风险发生率,给病人提供安全、优质、有效的护理服务。通过分析日常护理工作中存在的护理风险因素,来增强护理人员的风险意识,并制定完善的护理工作制度和风险管理
目的:探讨优质护理服务在神经内科护理中的应用效果。方法选取我院2015年4月~2016年4月收治的神经内科治疗患者167例,依据随机原则划分为参照组83例与研究组84例。参照组83例患
随着科学技术的迅速发展,无线传感器网络(wireless sensor network,WSN)技术也得到了较快的发展。由于无线传感器网络技术的特殊性,使其不管是在军事还是民用等许多领域都有
目的:对老年脑卒中患者行家庭跟进护理的效果进行分析。方法:选取本院2015年1月至2016年3月收治的88例老年脑卒中患者,其均符合我国神经内科疾病诊断标准,根据患者入院时间随机分
目的:随着老龄化进程的加快,老年群体的数量在与日俱增。而老化使老人的生理结构和功能发生退行性的改变,再加上老年常见慢性疾病(如高血压等)的影响,骨折在老年群体中成了普遍的现
基于ATM的无源光网络(APON)结合了无源光网络和ATM的特点,不仅可以利用光纤的巨大带宽提供宽带服务,也可以利用ATM进行高效的业务带宽管理,是一种较为经济的宽带接入解决方案
目的:进一步研究和探索消化道传染病的护理方法。方法:对消化道传染病的流行特征和临床特征进行归纳总结,明确提出护理要点。结论:科学有效的护理对于加速消化道传染病患者康复,控
目的:护理人员在对患者进行护理操作的过程中,发生相关法律、法规允许范围外的威胁患者人生安全及生命质量的事件统称为护理风险。近年来,护理风险的防范意义已逐渐获得临床广泛
目的:探讨老年股骨颈骨折患者运用护理干预的效果。方法:研究我院2013年5月至2015年12月期间随机抽取的80例老年股骨颈骨折患者,分为对照组与观察组各40例,其中对照组运用常规护
扩展频谱技术和软件无线电技术是当今通信领域中发展最快、最有前途的两项技术,而且将软件无线电技术应用于扩频通信系统,给整个系统带来极大的灵活性。另外,将扩频技术中应用最