说话人语音转换技术的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:wan6415383aa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人语音转换是为了实现合成语音中的说话人的多样性而产生的语音信号处理的一个新兴的方向,说话人语音转换在很多的领域有着广泛的应用,如军事上的说话人伪装、机器翻译、医疗卫生等。目前说话人语音转换的方法有很多,高斯混合模型法是其中效果比较理想的一种方法,本文的主要工作是基于该算法提出改进的转换算法。 本文首先阐述了说话人语音转换的基本概念和现状、语音信号处理的相关基础知识,然后对常用的几种说话人语音转换方法进行了分析比较。提出了改进的基于高使混合模型的语音转换算法。针对高斯混合模型方法中转换语音的频谱过平滑问题,通过假定转换语音和目标语音有相同的协方差,在高斯混合模型法和线性多变量回归法之间设置阈值,很好的解决了这一问题;针对转换后的频谱参数帧与帧之间的不连续的现象,通过考虑帧与帧之间的动态特征参数很好地解决了这一问题。 通过客观和主观测试,证明了改进的算法在很大程度上解决了传统的转换算法存在的相关问题。本文最后对改进的说话人语音转换方法存在的缺陷和不足进行了讨论,并展望了今后下一步的主要工作。
其他文献
近十年来,频率分集阵列受到很多的关注和发展。与普通阵列相比,频率分集阵列有诸多优势,例如,频率分集阵列的方向图呈现出有规则的扭曲形状,这可以为对抗干扰提供技术路径,但
正交频分复用(OFDM)是一种多载波调制技术,具有抗能力强、频谱效率高、数据传输速率高等优点,在高速率多媒体数据传输方面有独特的优势,同时由于它采用了离散傅立叶变换,所以
随着合成孔径雷达的不断发展,其在国防工业和民用领域的应用越来越广泛。为了更加充分地发挥SAR全天时、全天候、远距离、高分辨率、广域观测的特点,实际应用中,对SAR的分辨
在现代社会中,身份认证作为保护信息安全的一种方式,在国家安全、金融、司法、电子商务等应用领域都显得尤为重要。传统的身份认证方法(如钥匙、口令等)已不能满足社会的需要
近年来,随着通信产业与互联网络的迅猛发展,以及人们生活节奏的进一步加快,无线移动应用逐步深入人心。3G网络的全球广泛部署进一步为3G业务以及新型移动互联网的发展打下了
目前,多入多出技术(Multiple-input multiple-output ,MIMO)与正交频分复用技术(Orthogonal Frequency Division Multiplexing,OFDM)已被采用为下一代无线城域网标准(IEEE 80
深空探测是在卫星应用和载人航天取得重大成就的基础上,向更广阔的太阳系空间进行的探索。随着21世纪的到来,深空探测技术作为人类保护地球、进入宇宙、寻找新的生活家园的唯一
无线传感器网络是由大量计算、通信及存储能力有限的传感器节点组成的特殊网络,在军事和民用领域具有广泛的应用前景,是目前一个非常活跃的研究领域。数据查询是传感器网络中
航天相机是航天探测领域重要的遥感器,它分为航天侦察相机、航天测绘相机等多种类型,在民用、军事等方面也有着相当广泛的应用。在测试航天相机的性能时,需要将其产生的图像
认知雷达因其能适应日益复杂的检测环境,自提出以来,即受到全球范围内的关注。认知雷达具有从接收机到发射机的信息反馈机制,利用所感知的信息以及其他先验知识,对发射机和接