汉语语音合成韵律控制方法与实现的研究

被引量 : 0次 | 上传用户:as5881348
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学与技术的发展,语音合成和语音识别已经开始广泛应用于社会的各个方面,并且成为人工智能、语音信号处理以及人机多媒体交互研究领域的热点之一。然而对于语音合成来说,汉语不同于西方语系,表现在语法结构、语法规则、声学特性、韵律特征等多个方面。首先,汉语是声调语言,声调具有辨意作用。其次,字与字之间的音调前后彼此互相影响会发生变异,即出现协同发音现象。同时,连续语流中的发音中间还会有短暂的停顿,这体现了人说话的节奏感。在汉语的文语转换(TTS)中,对语音基频、时长、幅度等韵律信息的预测、分析和控制称作韵律控制。目前在汉语语音合成的韵律控制方法上还存在很多无法解决的问题,致使合成语音的音质在自然度和可懂度方面相对较低,还不能达到用户可以广泛接受的程度,从而制约了该项技术大规模地进入市场。针对上述问题,本文在广泛汲取汉语韵律知识和现代语音信号处理技术的基础上,对汉语语音合成技术及其实现方法进行了深入的研究,主要研究工作如下:1、本文从汉语的声学特点和韵律特征出发,诸如汉语的声调及特点、汉语的语调及模式,分析和研究汉语的韵律特征(基频、时长、幅度)、重音、停顿以及韵律边界之间的相互关系,提出了适用于汉语语音合成的韵律控制规则。2、通过对汉语的韵律及其层次结构的分析与对比,进行了韵律特征与韵律边界的声学分析,提出了韵律分层建模、韵律边界预测和韵律分层控制的思想。3、确定了以音节作为拼接的语音基元,采用基于数据驱动的统计模型和规则相结合的方法,实现韵律建模及其韵律控制。4、采用PSOLA算法,在有限范围内实现对合成基元的时长和基频的调整,以及它对合成语音音质的影响;研究了语调曲线的合成及其控制方法。利用上述方法,进行了汉语文语转换实验。实验结果表明,本文提出的语音合成与韵律控制方法是行之有效的。
其他文献
桁架桥的悬拼主要是以桁架节间为预制构件对象的悬拼和分别以组成桁架桥的上、下弦杆和竖杆、斜杆为预制构件对象的悬拼。以剑河桥为例,介绍施工过程。
<正>党的十八大以来,以习近平同志为总书记的党中央审时度势,准确把握国际国内形势的新变化、新特点,就我国外交战略方针和政策主张提出了一系列新思想新理念,引领我国外交进
在二十世纪九十年代,国外先进船厂通过研究应用CIMS软件系统,将人、财、物、设计及制造等信息融于一个系统,逐步确立了以信息技术作支撑的现代造船模式,实现了“生产效率大幅度提
包气带是降水补给地下水的一个主要环节,是了解补给变化的地质信息载体。以滹沱河冲洪积扇河北省正定试验场包气带剖面为研究对象,利用环境示踪剂(氚和氯)方法,估算了该区地
目的急性胰腺炎(Acute Pancreatitis,AP)是临床外科上一种常见的疾病,起病较急,病情也较重,死亡率也高,因此被广泛的关注,其机制不能单纯考虑胰酶自身的消化,目前逐渐侧重到
现代图像处理理论研究表明,新时期的数字图像处理技术要向高速度、高质量、智能化方向发展,且能够模拟生物视觉系统的处理过程。“第三代神经网络”—脉冲耦合神经网络(Pulse C
[目的]1.前期的研究表明,镁黄长石生物活性陶瓷(akermanite),具有良好的生物力学性能,并且在模拟体液中形成骨样羟磷灰石,能够明显促进大鼠成骨细胞的增殖。但并不知道,akerman
随着移动智能技术的不断发展,目前,移动金融时代已经强势来袭,并给传统的金融市场带来了极大的影响。在移动金融大背景下,各金融机构可以为广大客户提供更多的便利服务,并显
从“科学管理”到“服务管理”的跃进顺应了社会经济发展和现代竞争态势。在社会和技术飞速发展的今天,企业获取竞争优势的手段和方法都发生了很大变化,企业必须综合运用通过顾
采集2个不同深度包气带土壤水2 H、18 O同位素剖面ZK1,ZK2,应用天然稳定同位素2 H、18 O示踪的方法,研究了华北山前冲积平原石家庄地区包气带土壤水入渗补给的历史演化特征。