基于时长变化的GMM语音转换系统

来源 :长江大学 | 被引量 : 1次 | 上传用户:qianjiuzhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号中除了包含语音内容信息外,还包含说话人声音特征形式信息。在保证发音者语音内容讯息不发生变化的前提下,通过转变源说话人的语音个人特性,使之具备目标说话人语音个人特征的技术称为语音转换。这项技术几乎囊括了语音信号处理领域的各个方面,是当前比较热门的技术之一。针对语音的韵律特征,它对转换系统最终的合成语音的自然度、可懂度有很大影响。本课题在基于传统高斯混合模型的语音转换系统上提出对转换后韵律特征中的时长进行改变的算法,填补了以往通过G础模型转换后语音自然度不高的弊端,提高转换后语音的可懂度。本论文主要探究了基于高斯混合模型的语音转换系统中所使用的重要技术,再对转换后的语音进行测评,分为客观评价与主观评价,以此判定所设计出的转换系统的好坏程度。主要工作如下:
  1、基于时长变换的语音转换系统除了完成基本的语音转换要求外,还解决了经系统转换之后获得的合成语音音质不自然粗糙等问题;从语音的发声机理开始研究适合于语音转换系统的语音分析模型,与其相对应的语音参数以及用于语音转换系统中的转换算法。着重研究了基于高斯混合模型的语音转换系统的主要算法,并对其进行了仿真实现,给出了主客观测试结果。
  2、针对传统语音转换系统普遍存在的语音自然度低的问题,提出并实现了一种基于时长变化的语音转换系统的改进算法,通过对转换后的参数插值变换来改变语音的时长。测评结果表明经过改进后的转换语音自然度和可懂度都有一定程度的提高。
  3、在采取上述改进算法的GMM语音转换系统中,选取更利于人耳声音感知的美尔倒谱参数MFCC进行变换操作:给出了转换前后语音的MFCC三维图以及语音波形图,实验结果表明采用改进算法后的转换语音和目标语音较为接近,语音转换系统的质量得到了提高。
其他文献
期刊
期刊
期刊
会议
会议
期刊
期刊
工业数据采集、存储技术是嵌入式领域里常常需要研究的学科之一。传统的工业数据采集、存储方案主要有两种:一是采用专用的不掉电的专用存储器芯片,二是通过计算机的串行口将数据转移至PC上存储。然而现代化的工业现场往往需要采集大容量的移动数据以便带至实验室进行二次数据分析,显然上述两种传统的数据采集、存储方案均不能满足要求(方案一数据存储量有限,方案二数据移动性差),本文鉴于以上方案的不足提出了一种新的工业
学位
超声反射测井是一种经典的测井方法,在目前的油气勘探中,仍然有很多的应用。随着解决地质问题难度的增加,对超声反射测井仪器的性能提出了更高的要求,主要反映在:①要求记录的动态范围增加,精度提高;②要求能自动补偿井液对超声波的衰减,使仪器能够适应不同比重泥浆环境的测井需求;③进一步提高仪器的集成度,以适应不同井径油井的测井;④进一步降低仪器的功耗,提高仪器的高温特性;⑤将井壁超声成像和超声固井质量检测两
期刊