说话人转换建模方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:weiqing1120
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号中不仅包含了语言学的信息,也承载了说话人的个性信息,说话人身份在语音通信中有着重要的作用。说话人转换是语音信号处理研究领域相对较新的一个方向,其目标是改变一个说话人的语音,在保持语义内容不变的情况下,使其听起来像是另外一个说话人的语音。说话人转换的研究对于语音信号处理来说有着重要的理论价值和应用意义。近十几年来,随着基于统计参数模型——高斯混合模型(Gaussian mixture model, GMM)的说话人转换方法的提出,它以其自动化程度高、系统构建快、鲁棒性好、转换语音相似度高、平滑稳定等优点,得到了越来越多的研究者的关注,并逐步发展为当今最主流的一种说话人转换方法。对说话人转换方法性能的优劣的评价有两个方面:与目标说话人的相似度和语音的自然度,现阶段的GMM转换方法在相似度方面的表现还不错,但是转换语音的音质不佳,导致其自然度与自然语音之间存在不小的差距,而且该方法对训练数据有特殊的要求,造成了基于该方法的系统构建的灵活度不足。本文以统计建模在说话人转换的频谱转换中的应用为研究重点,从两个角度来提出改进的方法。第一,模型的角度,一方面,在联合空间的建模中引入独立的线性变换,直接对转换函数建模,另一方面,使用受限玻尔兹曼机(restricted Boltzmann machine, RBM)代替高斯分布对特征空间的建模,改善建模的精度。第二,从特征的角度,使用两种方法分别对语音信号中的说话人信息和内容信息进行建模:基于话者无关空间的内容信息建模和使用深层神经网络的特征分解,直接对说话人信息进行转换,提高了转换的灵活性。整篇文章的安排如下:第一章是绪论,将简介说话人转换的研究范畴、研究意义,回顾该领域研究的发展历史和现状。第二章首先将分析影响语音信号中的说话人特征的因素,并以此展开介绍基于GMM的说话人转换方法,包括GMM的基本原理、系统框架、关键技术点、主要的几种频谱转换方法等,并通过对此方法特点的分析,阐明我们进行新的说话人转换建模方法研究的动机与出发点。第三章将介绍一种改进的联合空间模型,针对传统GMM模型中没有直接对转换关系建模的不足,使用显式特征变换关系来对源目标说话人之间的变换关系建模并对联合空间的概率分布加以限制,改善模型的建模精度,并扩展到非并行数据的训练以改善训练的灵活度。第四章将介绍两种将分别对语音信号中的说话人特征和内容特征的建模方法。第一是使用话者无关模型来描述说话人之间共有的音素空间,使用从该空间到话者相关空间的变换来描述说话人信息。第二是使用深层神经网络直接对语音信号进行高层编码,在编码中提取出说话人特征和内容特征。通过对说话人信息的单独建模,转换时,仅对说话人信息进行转换,提高了转换的灵活度。第五章将介绍一种使用RBM来对联合特征空间的概率分布进行建模,以及使用该模型直接对原始的语音频谱包络转换的方法。在简单的回顾了基于高斯的模型在建模能力上的不足之后,我们提出在传统的GMM建模的框架下,使用RBM来代替高斯分布对每个混合空间的概率分布进行建模并从中导出特征的转换关系,通过实验验证了该方法对转换语音相似度和音质的显著改善。第六章将对全文进行总结。
其他文献
近年来,综合医院逐渐重视康复医学科的发展,顺应患者需要开展多方面的康复医学宣教,但因康复医学科发展较晚,在科室管理模式上相对于其他科室较为落后。面对西方医学康复医学
探讨磁共振弥散加权成像(DWI)和动态增强成像(3D-LAVA)对肝转移瘤小病灶检出及诊断的价值。选取河西学院附属张掖人民医院确诊的肝外恶性肿瘤行多排螺旋CT(MDCT)检查的患者12
<正>《湖北省总工会改革实施方案》于2016年12月9日经省全面深化改革领导小组第十一次会议审议通过,绘就了工会改革的路线图,吹响了工会改革的冲锋号。一年多以来,我省工会改
怎样才能让小学生在学中玩,玩中学,学中乐,轻松愉快地获得知识呢?实践证明:恰当地使用现代教育技术教学手段,不仅可以激发学生学习知识的兴趣,而且更有利于开阔学生的视野,扩大知识面
听说读写能力的培养是中学英语课堂教学中学生能力的培养目标和教学宗旨,而在这四种能力的培养当中,英文写作能力的培养则是难度较为艰巨的一项教学任务。
目的:探讨连续硬膜外麻醉分娩镇痛对高危产妇妊娠结局的影响。方法:将我院在2019年1月至2020年6月收治的高危产妇80 例纳入本次研究,以数字表排序的方式,将其划分为2组。排序
近年来,在张掖市,农机合作社的发展势头十分迅猛。数据显示,2007年全市只有3家农机专业合作社,而到2016年底,全市农机专业合作社的数量增加到了267家。
随着现代经济文化的进步,社会对教学的要求越来越高了,既要求提高学生的学习成绩,还希望学生有一个好的教学环境,能够综合发展。应对教学要求多元化的发展趋势,学校采取了各种措施
刑法上的犯罪可以分为作为犯和不作为犯。不作为犯又可以分为真正不作为犯和不真正不作为犯。目前,不真正不作为犯罪是刑法学界研究的重点问题。在不真正不作为犯问题的研究
一、心与学生的心融在一起消除师生合作之间的心理障碍关心、爱护学生是教师的天职,爱为师德之本,无爱则无教育。施爱是处理好师生关系的关键所在,老师必须真心诚意去爱每一个学