基于GMM和BP网络的语音转换系统设计

来源 :武汉理工大学 | 被引量 : 5次 | 上传用户:dffder
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换技术是当前语音信号处理领域的研究热点之一,其在人机交互、语音修复、影视配音、语音伪装和保密通信等方面有着广泛的应用。目前语音转换的研究主要集中在频谱包络和韵律特征等的转换上,但在对其的转换上还未达到好的效果。本文在研究分析现有语音转换算法的基础上,设计构建了基于高斯混合模型GMM和BP神经网络的语音转换系统,并完成了算法仿真和语音转换系统实现。最后采用客观评价和主观评价方法对系统进行了性能评价。本文主要研究内容如下:(1)在分析语音转换的基本原理、语音的时域特性、语音的个性特征参数和语音转换算法的基础上,选取了语音信号的频谱包络及其残差和基音周期作为语音转换的特征参数,选用了GMM模型和BP网络模型进行训练和转换。设计了基于GMM和BP网络的语音转换系统总体框架。(2)完成了源和目标说话人谱包络LPC系数及频谱包络残差的提取,在研究GMM模型基本原理的基础上,用EM算法和K-Means算法对GMM模型的初始参数进行估计,利用估计的初始参数对提取的LPC参数进行GMM模型训练,得到其映射函数,并据此对源语音的LPC系数进行转换,仿真分析了基于GMM模型谱包络的源、目标和转换后语音的时域波形和语谱图。(3)采用GMM模型完成了对源和目标语音谱包络残差的训练,得到了源和目标语音残差码本的映射关系,并通过映射关系对源语音的残差进行了转换,仿真分析了基于GMM模型残差的源、目标和转换后语音的时域波形和语谱图。(4)在分析讨论BP网络基本原理和算法的基础上,完成了源和目标说话人的基音周期的训练,通过训练网络实现了源与目标说话人的基音周期的转换,并仿真分析了源、目标和转换后的时域波形与语谱图。(5)完成了GMM和BP网络两种模型相结合后分别对说话人语音的频谱包络LSF参数、频谱包络残差和基音周期三种特征参数的训练和转换,仿真分析了转换前后的时域波形和语谱图;并完成了基于GMM和BP网络的语音转换系统功能设计及系统实现,采用客观评价和主观评价的方法对系统中四种转换方法模型进行了性能评估,比较得到基于GMM和BP网络语音转换方法的优越性。
其他文献
土壤重金属污染是非常严重的生态环境污染,对于人体健康具有巨大危害.分析发现,部分地区的土壤镉污染比较严重,镉元素会在人体内集聚,导致人体出现慢性中毒症状,严重损害人体
心理健康教育对高职院校学生学习生活意义重大,是促进学生身心健康发展的基础所在.因此,做好高职院校学生心理健康教育,应该立足于学生的个性特点,从拓展心理健康教育的渠道
随着5G时代的到来,为高科技的不断发展带来了良好的时机.本文主要阐述了5G通信技术的发展,以及在5G通信技术在电力通信中的相关应用探究.伴随着2020年钟声的敲响,21世纪20年
文章先分析了5G对于4G网络建设的影响,随后介绍了4、5G网络协同优化的具体措施,包括CRAN架构集中化与超密组网、提升网络移动宽带服务水平、面向未来发展促进5G网络升级,希望
随着移动通信技术的日新月异,5G网络取代4G网络已经成为现实.而室内分布系统的网络建设是5G网的核心技术,室内分布系统针对不同的场景提出了系统的组网需求.5G室内分布系统的
随着计算机通信网络技术的不断发展,计算机通信已经发展成为人们生活中必不可少的一部分.但是,我国的计算机通信网络安全问题一直很严重,人们现在越来越关注计算机通信网络安
随着社会的不断进步以及信息技术的快速更新,对信息通信工程的运行安全性提出了更高的要求.而传输技术在信息通信工程中的应用,不仅可以提高信息传输的效率和稳定性,而且还能
电源是通信平台的重要组成部分,其可以为通信供应能源,保证通信设备正常运行。通信电源系统组成设备多,因此需要加强数据采集和运行监控,确保通信电源系统工作状态良好。