语音转换系统中特征参数的研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:comeonlinli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换是通过改变与说话人个性特征有关的声学特征参数,使得转换后语音的个性特征与目标说话人更接近。本文重点研究语音转换系统中语音特征参数的有效提取和转换规则,使转换后的合成语音在更接近目标语音的同时,语音的自然度有所提高。论文主要工作如下:1.研究了语音发音原理和数学模型、语音转换关键技术,以及语音转换系统的性能评价方法;重点研究了目前常用的几种语音特征参数的提取方法和用于声道特征参数转换的几种经典方法。2.通过对目前常用的语音特征参数的分析对比可知,MFCC参数基于人耳听觉感知特性,且低频段具有较高谱分辨率的优良特性。同时基于STRAIGHT模型可以对语音特征参数进行准确提取并进行较大幅度修改,因此本文研究了基于STRAIGHT模型提取MFCC参数,引入GMM模型进行特征参数转换,构建实验平台进行仿真,实验结果表明转换后语音更加接近于目标语音。3.在线性预测分析的基础上,提出了一种基于谐波加噪声模型的改进算法。该算法基于HNM模型分解语音信号,提取谐波成分的语音特征参数,并利用线性预测分析法进行谐波逆滤波得到对应的谐波残差激励信号,然后进行转换后的语音合成。最后将经HNM模型分解的语音随机噪声成分叠加到合成语音上进行噪声补偿,提高了转换语音的自然度和目标倾向性。
其他文献
利用卫星遥感技术进行地球资源勘探、环境及自然灾害监测变的过程中,云是个很大的障碍,云的存在严重影响了信号的传播,极大的降低了遥感影像数据的利用率。因此,利用卫星遥感观测
单脉冲测角技术因其具有精确的角度测量特点,被广泛地应用在探测、制导以及电子对抗等多个场合。针对传统单脉冲方法容易受到外界电磁干扰的影响,并且考虑到自适应波束形成技术
图像目标识别是当前机器视觉和模式识别领域中一个十分重要的研究课题,被广泛应用于众多领域,如医学图像处理、军事自动目标识别、遥感图像分析。近年来基于显著性检测的目标
随着科学技术不断发展和人们对目标跟踪实际需求的不断增加,目标跟踪问题开始受到广泛关注。目标跟踪技术已经广泛应用于军事领域如战场监控、预警、攻击、火力控制等,和民用
物联网是一种对人和物定位、跟踪、识别和监管的智能化网络,“三网融合”理念的提出,推动了物联网技术的快速发展。智能视觉物联网是物联网的视觉感知部分,本文融合通信、计
随着互联网的飞速发展,全球数据量每年以指数增长,使得云计算成为了当前研究与应用的热点。云存储作为云计算的底层服务,是一种架构复杂的分布式文件系统。因为它具有结构灵活、
随着全球导航卫星系统(GNSS)的不断发展和完善,用户对GNSS接收机性能的要求不断提高。为了研究出高性能的软件接收机,需要对接收机的接收算法进行不断的优化。GNSS数字中频信
当对天线进行优化设计时,可以结合电磁仿真软件HFSS和粒子群优化算法予以实现,但是调用HFSS评估粒子群算法的适应度时需要花费大量的时间,同时也对计算机性能有较高的要求,从
视频作为一种信息含量十分丰富的信息载体,已经成为当今信息时代不可缺少的重要组成部分。由于视频序列通常拥有庞大的数据量,如何进行有效地数据压缩一直是人们研究的热点。
形式概念分析是一种对形式背景中的数据进行分析和规则提取的理论,在本体研究、软件工程等众多领域有广泛应用。而随着网络技术快速发展,涌现出越来越多像folksonomy的三维数