基于高斯混合模型的语音转换技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:lhmsgy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换是指改变一个人的语音特征,同时将其转换为另外一个人的语音特征,从而使源说话人的语音听起来像目标说话人的语音的一种语音处理技术。语音转换是语音信号处理领域一个比较新的分支。随着现代生活水平的提高,人们不再单单追求语音的可懂度,而更加强调语音的个性化特征,因此,该技术的研究不仅具有重要的理论意义,同时也具有巨大的应用价值。本文的主要工作:一、对语音发音系统和模型、语音转换技术的基本理论和方法、常用的语音特征参数进行了讨论;研究了基于高斯混合模型(GMM)的谱包络转换方法。二、针对转换后语音的谱包络过于平滑的现象,本文提出了考虑谱包络全局变化特性的转换算法GMM-GV,仿真实验表明,这种方法有效地克服了谱包络的过平滑性。三、基于GMM-GV的转换算法是对每帧语音进行处理,没有考虑到帧间的相关信息,本文采用维特比算法对GMM-GV转换系统进行改进,提出了一种改进的基于帧选择的语音转换系统GMM-GV-Viterbi,提高了转换后的语音质量。四、传统的基于高斯混合模型的基频转换方法,没有考虑到基频的时序信息,本文采用维特比算法对基于GMM的基频转换系统进行改进,提出了一种改进的基频转换系统GMM-Viterbi,从而使得转换后的语音音色更接近目标说话人特征。
其他文献
图像复原与增强是图像处理和计算机视觉领域中的经典问题,其目的是根据图像降质原理及相应准则,对降质图像进行相关复原或增强处理,从而提高图像质量以满足人眼视觉或后续处理的
随着计算机网络以及多媒体技术的飞速发展,以大型服务器和PC机为平台的视频共享如雨后春笋般不断涌现,这在一定程度上满足了人们的精神文化需求,但它移动不便,且成本高昂,也成为了
随着微电子学,数字电路和无线通信等技术的发展,无线传感器网络(Wireless Sensor Network, WSN)的使用已经成为了现实。随后,关于WSN的感知能力及应用研究层出不穷。WSN是一种由
激光再现汉字的识别是激光全息加密技术中必须解决的关键问题,它为辨别激光全息防伪标识的真伪提供了机器识别的途径,能够极大提高激光防伪标识的防伪力度。因此,开展防伪机器识
在传统的LTE系统中,小区间的相互干扰较为严重,现有的干扰协调技术不能很好地解决小区边缘用户频谱效率较低的问题。为了满足ITU为IMT-Advanced系统提出的性能指标,3GPP提出了LT
随着通信技术的不断演进,对于算法仿真和测试验证越来越需要放到更接近实际应用的场景中进行评估,传统的算法验证只能在纯软件的仿真平台下进行,其存在的问题是不能模拟真实
时间同步是无线传感器网络一项重要的基础服务,是实现协同休眠、目标跟踪和数据融合等技术的基础。由于无线传感器网络低功耗、低成本、低复杂度等特点,传统的时间同步算法如
虚拟骨干网可以有效的提升无线网络的通信性能。近些年提出的网络编码技术在无线网络中同样具有很大的应用前景――可以很好的改善无线网络网络性能。论文着重考虑网络编码在
超宽带无线通信作为下一代无线通信网络的关键技术之一,具有抗干扰性能强、带宽极宽、功耗低、安全性高等特点,是无线通信中的研究热点。超宽带通信系统对信道衰落的敏感度高
随着我国高速公路建设的快速发展,高速公路路基、路面、桥涵隧构造物和沿线设施的检测工作越来越受到重视。如何快速、客观、准确地检测高速公路沿线设施的损坏项目,对我国高速