基于共振峰参数的源—目标声音转换方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:oslo123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
源—目标说话人声音转换是将源说话人的语音模式转换成某个特定的目标说话人的语音模式,而保持源说话人原有的语义内容不变,使转换后的语音具有目标说话人的声音特点。声音转换是当前语音信号与信息处理研究领域的一个热点,除了理论方法研究外,其应用前景也非常广泛,包括文语合成系统的定制、电影广播剧角色的自动配音、多说话人语音语料的采集和传输等。 本文研究的源—目标说话人声音转换是基于共振峰分析—合成模型的,主要研究声道共振峰的参数表示和提取方法,与文本无关的声道共振峰参数映射规则的获取方法,以及共振峰合成器。 首先研究了共振峰分析—合成模型,深入讨论并验证了共振峰参数中所表征的说话人个性特征,针对语声中浊音和清音不同的共振峰结构特点,对浊音和清音采取了不同的参数表示方法,并给出了一种基于线性预测的共振峰提取算法。 为了获取文本无关下的源—目标参数间的映射规则,采用了基于分类的映射规则获取思想,对分类线性转换方法(CLT)进行分析研究,并在此基础上,本文给出了一种基于径向基函数神经网络(RBFNN)的分类线性加权转换方法,以输入特征矢量对各个类别(隐层节点)的“贡献”作为各子类转换规则的权值,转换后的特征矢量为各子类输出的加权,这种加权组合的方法使一定分类下的映射规则得以极大的增多,可以提高转换效果。实验结果表明,在相同的分类数时,RBFNN方法的转换效果优于CLT算法;并可在较少训练数据下也有较好的转换效果。 文中还详细讨论了共振峰参数合成器基本原理和组成结构,包括激励源模型和声道模型。由于激励源特征在确定说话人身份方面起着非常重要的作用,所以讨论了基音频率的提取和转换方法。通过共振峰合成器合成语音实验验证了其合成语音的效果。
其他文献
学位
本文在对超高频电子标签的相关理论和技术进行深入分析的基础上,根据ISO/IEC18000-6TypeA型协议,对工作在915MHz频段的电子标签的模拟前端电路进行了研究和设计。 首先对整
目的:研究遗传性因素对房颤的影响。利用β-受体激动剂可以诱导心肌损伤,使心肌细胞出现凋亡与坏死,但其作用机制一直不是很清楚。MiRNA作为心血管疾病潜在的诊断生物学标志和新
最近几年来,无线通信技术逐渐走向成熟,随之无线通信系统也被广范的应用在军事、民用等各个方面。射频电路是无线通信系统的前端装置,随着小型化设备需求增加,对射频电路的要求也
随着智能手机与平板电脑等移动智能终端设备的迅猛发展,交互式应用逐渐替代传统计算密集型应用,成为决定用户体验的关键因素。交互式应用,如高清视频,高保真音频,高分辨率3D动画,动
随着GPU技术的发展,利用GPU的计算资源来提高计算效率已经成为一个必然的趋势。目标跟踪是计算机视觉领域的重要研究课题之一,其算法大都采用CPU串行计算,并没有考虑GPU的计算资
二氢叶酸还原酶(dihydrofolate reducase,DHFR)高表达是肿瘤细胞对氨甲蝶呤(methotrexate,MTX)产生耐药的主要机制之一。MTX耐药细胞系中常常出现DHFR基因扩增伴随与其共用一个
论文针对地球—电离层波导系统内极低频/特低频电磁波产生的谐振电磁现象,即舒曼谐振(Schumann Resonance, SR)电磁现象进行研究。近些年来对舒曼谐振电磁现象的研究表明,它的变
ZigBee RF4CE技术是第一个对家庭设备进行双向交互控制的公共分布规范,具有低速率、近距离、低功耗、低成本、简单易用的特点,成为智能家居组网协议的新选择。然而,RF4CE协议栈
“小学数学课堂教学必须让孩子们对未知的数学知识能有一个图形结合的感知。从而激发孩子的兴趣和学习数学的积极性,在学习中如何才能让孩子们喜欢数学、钻研数学,这就要求教师