基于分类映射的非并行语料语音转换

来源 :苏州大学 | 被引量 : 0次 | 上传用户:zhe0731
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换是指通过改变与源说话人个性特征有关的声学特征参数,使之听起来像是目标说话人的语音,而其中的语义是不发生变化的。传统的语音转换需要采用并行语料,训练源-目标说话人语音模型,得到语音转换规则;但实际应用中很难获得并行的语料,本课题研究一种基于分类映射的非并行语料的语音转换,改变的声学特征参数为基音和谱包络,主要内容包括:1.研究STRAIGHT分析与合成算法,基于STRAIGHT平台调整与说话人个性特征有关的参数。2.采用非平行语料,由STRAIGHT提取傅立叶短时谱和基音频率F0。谱包络基于K均值分类,然后采用DFW进行分类映射并组成联合特征矢量,最后采用GMM模型训练得到转换函数3.给出基于分类映射的非并行语料语音转换系统总体框架,并编程实现整个系统。最后通过ABX和MOS实验表明论文提出的语音转换方法可以得到与传统的并行语料语音转换接近的转换性能,转换语音的目标说话人识别正确率达到95.5%。实验结果充分说明了本课题提出的方法不仅具有较好的转换性能,而且更具有实用性。
其他文献
电子散斑干涉测量技术是一种对物体表面、内部进行全场无损检测的技术,其方法简单易行、无需接触、全场进行测量,对物体表面的光滑程度要求比较低,具有很强的抗干扰能力,在形变、
心血管疾病作为人类第一杀手,至今在全球范围内是死亡的主要原因。随着人们生活水平的提高,在大部分疾病都得到有效控制的情况下,心血管疾病发病率却是不降反升。在心血管疾
在历史研究过程中,文物是非常重要的研究史料,同时也是稀缺的文化资源,对于历史研究领域具有举足轻重的作用.但是,在当前的文物保护实践中,保护力度明显不够,要想有效保护文
混沌理论在诸多领域有着广泛的应用,尤其在微弱信号的检测中越来越展示其优越性。对于传统的微弱信号检测方法,输入信噪比门限受到一定的限制,很难进一步降低,不能有效地检测
虹膜识别作为身份识别的重要方法之一,近些年来应用广泛。虹膜识别过程涵盖虹膜图像获取、虹膜图像预处理、特征提取、特征匹配等步骤,而虹膜图像预处理部分包括虹膜分割定位
在现代通信系统中,VoIP(Voice over IP)已经成为一个热门领域,并且得到了广泛的应用,但是同时网络电话的语音传输质量成为制约其发展的重要因素,与其他语音算法相比,iLBC(Internet
无线传感器网络直接感知客观世界,改变了人类与自然界的交互方式。然而由于无线传感器网络应用系统所采集的数据必须与节点自身相对应才有意义,所以定位已经成为传感器网络应
芭蕾舞一直是人们认为优雅有品位的舞蹈之一,随着人们生活水平的提高,对自身的形体要求也越来越高,很多人会利用自己空闲的时间来学习芭蕾舞,尤其是青少年对于芭蕾舞的学习更
混沌广泛存在于客观世界中,混沌信号具有遍历性、非周期、连续宽带频谱、类噪声的特性,具有广阔的潜在应用价值。混沌同步的实现为混沌保密通信提供了理论基础,使得混沌同步
随着社会的发展,人们对资源的需求越来越大,陆地资源的匮乏日益明显。近些年来,随着科学技术的进步,人们对海洋的开发越来越多,丰富的海洋资源为人们提供了一片新天地。但现