论文部分内容阅读
语音转换是通过改变与说话人个性特征有关的声学特征参数,使得转换后语音的个性特征与目标说话人更接近。本文重点研究语音转换系统中语音特征参数的有效提取和转换规则,使转换后的合成语音在更接近目标语音的同时,语音的自然度有所提高。论文主要工作如下:1.研究了语音发音原理和数学模型、语音转换关键技术,以及语音转换系统的性能评价方法;重点研究了目前常用的几种语音特征参数的提取方法和用于声道特征参数转换的几种经典方法。2.通过对目前常用的语音特征参数的分析对比可知,MFCC参数基于人耳听觉感知特性,且低频段具有较高谱分辨率的优良特性。同时基于STRAIGHT模型可以对语音特征参数进行准确提取并进行较大幅度修改,因此本文研究了基于STRAIGHT模型提取MFCC参数,引入GMM模型进行特征参数转换,构建实验平台进行仿真,实验结果表明转换后语音更加接近于目标语音。3.在线性预测分析的基础上,提出了一种基于谐波加噪声模型的改进算法。该算法基于HNM模型分解语音信号,提取谐波成分的语音特征参数,并利用线性预测分析法进行谐波逆滤波得到对应的谐波残差激励信号,然后进行转换后的语音合成。最后将经HNM模型分解的语音随机噪声成分叠加到合成语音上进行噪声补偿,提高了转换语音的自然度和目标倾向性。