论文部分内容阅读
语音信号中除了包含语音内容信息外,还包含说话人声音特征形式信息。在保证发音者语音内容讯息不发生变化的前提下,通过转变源说话人的语音个人特性,使之具备目标说话人语音个人特征的技术称为语音转换。这项技术几乎囊括了语音信号处理领域的各个方面,是当前比较热门的技术之一。针对语音的韵律特征,它对转换系统最终的合成语音的自然度、可懂度有很大影响。本课题在基于传统高斯混合模型的语音转换系统上提出对转换后韵律特征中的时长进行改变的算法,填补了以往通过G础模型转换后语音自然度不高的弊端,提高转换后语音的可懂度。本论文主要探究了基于高斯混合模型的语音转换系统中所使用的重要技术,再对转换后的语音进行测评,分为客观评价与主观评价,以此判定所设计出的转换系统的好坏程度。主要工作如下:
1、基于时长变换的语音转换系统除了完成基本的语音转换要求外,还解决了经系统转换之后获得的合成语音音质不自然粗糙等问题;从语音的发声机理开始研究适合于语音转换系统的语音分析模型,与其相对应的语音参数以及用于语音转换系统中的转换算法。着重研究了基于高斯混合模型的语音转换系统的主要算法,并对其进行了仿真实现,给出了主客观测试结果。
2、针对传统语音转换系统普遍存在的语音自然度低的问题,提出并实现了一种基于时长变化的语音转换系统的改进算法,通过对转换后的参数插值变换来改变语音的时长。测评结果表明经过改进后的转换语音自然度和可懂度都有一定程度的提高。
3、在采取上述改进算法的GMM语音转换系统中,选取更利于人耳声音感知的美尔倒谱参数MFCC进行变换操作:给出了转换前后语音的MFCC三维图以及语音波形图,实验结果表明采用改进算法后的转换语音和目标语音较为接近,语音转换系统的质量得到了提高。
1、基于时长变换的语音转换系统除了完成基本的语音转换要求外,还解决了经系统转换之后获得的合成语音音质不自然粗糙等问题;从语音的发声机理开始研究适合于语音转换系统的语音分析模型,与其相对应的语音参数以及用于语音转换系统中的转换算法。着重研究了基于高斯混合模型的语音转换系统的主要算法,并对其进行了仿真实现,给出了主客观测试结果。
2、针对传统语音转换系统普遍存在的语音自然度低的问题,提出并实现了一种基于时长变化的语音转换系统的改进算法,通过对转换后的参数插值变换来改变语音的时长。测评结果表明经过改进后的转换语音自然度和可懂度都有一定程度的提高。
3、在采取上述改进算法的GMM语音转换系统中,选取更利于人耳声音感知的美尔倒谱参数MFCC进行变换操作:给出了转换前后语音的MFCC三维图以及语音波形图,实验结果表明采用改进算法后的转换语音和目标语音较为接近,语音转换系统的质量得到了提高。