【摘 要】
:
语音是人类交流最为方便快捷的方式。随着人机对话技术的发展,人们对合成语音的质量要求越来越高。语音基频曲线对合成语音的自然度有决定性的作用,对语音基频包络的建模成为人
论文部分内容阅读
语音是人类交流最为方便快捷的方式。随着人机对话技术的发展,人们对合成语音的质量要求越来越高。语音基频曲线对合成语音的自然度有决定性的作用,对语音基频包络的建模成为人机交互领域的一个重要研究课题。本文提出了一种利用FDA(Functional DataAnalysis,泛函数据分析)对语音基频包络建模的新方法,建立了汉语普通话和兰州方言单音节的四种不同声调的基频曲线的FDA模型,并利用建立的基频模型实现了普通话到兰州方言的转换。论文工作对于实现普通话和兰州方言的韵律建模、揭示普通话和兰州方言之间的联系与区别有重要的理论意义和应用价值。论文的主要工作如下:1.提出了一种利用泛函数据分析FDA(functional data analysis)对语音基频包络建模的新方法。用B-样条函数对语音的单字基频进行数据平滑处理,得到平滑后的基频曲线,将平滑后的基频曲线再进行两次时间校准处理,最后通过主成分和主微分分析,最终得到拟合后的基频曲线。将原始基频与拟合后的基频曲线进行对比分析,实验结果表明,本文提出的建立基频模型的方法,具有一定的可行性,可应用于语音合成等语音信息处理研究中。2.建立了普通话和兰州话的FDA基频曲线模型。标注了普通话和兰州方言的4种声调的160个单音节的基频包络,用FDA方法对普通话和兰州话的四种声调的单字基频曲线建立了基频包络模型。论文对普通话和兰州方言的FDA基频模型拟合得到的基频曲线分别进行了误差分析,得到原始普通话基频与拟合后的普通话基频曲线间的均方根误差为6.47Hz,相应的兰州方言的FDA基频模型其均方根误差为3.88Hz。论文采用STRAIGHT算法,利用模型产生的基频包络重新合成普通话语音和方言语音,主观评测结果表明,普通话的MOS得分为4.17,兰州话的MOS得分为4.19分。实验验证了FDA基频模型的在基频建模上的适用性。3.实现了普通话到兰州方言的转换。首先,通过输入的文本得到兰州方言的声调信息,同时利用输入的普通话语音文件用STRAIGHT方法得到四种声调对应的谱参数和基频包络,然后,利用已建立的兰州方言的FDA模型产生不同声调的兰州方言基频包络F0值,最后利用模型得到的兰州方言F0值和普通话的谱参数用STRAIGHT方法合成兰州方言。转换的语音的DMOS得分为3.88,表明基于FDA的基频建模方法能够应用于方言的语音转换中。
其他文献
大量研究表明脑缺血再灌注可以激活JNK,而且JNK激活在局灶和全脑缺血介导的神经元凋亡过程中发挥重要作用。但是,脑缺血诱导JNK激活的下游凋亡信号通路还有待进一步阐明。本文
本课题来源于国家科技支撑计划课题“海上遇险目标快速接近技术”,该课题其中的一项内容就是对水下遇险目标进行高清晰观测。但水下环境复杂,水中不仅含有大量的悬浮颗粒,而
本研究主要包括阿魏侧耳液体培养基的筛选、发酵条件的优化和胞外多糖理化性质的分析三方面的内容,其结果如下: 1、通过单因子试验和正交试验,确定适合菌丝生长的优化培养基配方为:VBl0.002%,葡萄糖3%,蛋白胨0.15%,(NH4)_2SO_40.05%,酵母膏0.3,MgSO_40.05%,KH_2PO_40.1%,ZnSO_40.02%,NaCl0.03%。适合产生胞外多糖的优化培养基配
脱机手写数字识别技术因其在文档、统计、票据、邮件等方面的广泛涉及,成为了研究人员近年来重点研究的课题,阿拉伯数字也是全世界唯一通用的字符。随着社会金融业等行业的发展
太阳能是一种取之不尽用之不竭的清洁能源。近年来,太阳能技术的发展显示了其巨大优势。利用光生伏特效应可以直接产生光生载流子,基于此,光伏太阳能电池应运而生。目前,商用的晶硅太阳能电池作为光伏产业市场的主流,其效率只有18%。主要原因是晶硅太阳能电池的硅半导体带隙吸收的太阳光与入射太阳光不匹配,即能量高的光子以晶格热损失的形式将多余的能量散失掉而产生的能量传递损耗。虽然能量低于硅半导体带隙的光子,不能
频率选择表面(Frequency Selective Surfaces, FSS)作为一种空间滤波器,它的应用十分广泛,如在卫星通信中作为副反射面可以有效地提高系统利用率;在战斗机中作为雷达天线罩,可
当前微电子器件和系统正朝着小型化、低功耗、多功能的方向发展,晶体管的特征尺寸不断缩小并逼近物理极限,互连引起的时延和功耗不断增加,提高集成度的工艺难度也日益加大,传
面对信息技术和集成电路技术的高速发展,当今业界和消费市场对模数转换器(Analog to Digtal Converter,ADC)的精度、速度和功耗等方面的要求也渐为苛刻。作为实现高速高精度模数转换器设计的重要结构,流水线ADC的设计面临着诸多挑战,其中重要的一环便是对误差校正算法的设计。在基于传统结构流水线ADC的校正算法发展日益成熟的今天,利用新的流水线ADC的结构特点,开展校正算法的研究,
为了减少能量受限的无线传感器网络节点能耗、均衡网络负载、延长网络生存时间,本文在分析现有几种主要分簇拓扑控制算法的基础上,论述优化算法、提升网络性能所要考虑的因素
本文研究成批到达的具有第二次多选择服务的单服务员排队系统.顾客的到达形成一广义泊松过程,不同批的顾客按先到先服务的规则,而同一批的顾客按随机次序接受服务.两次服务的