基于隐马尔可夫模型的说话人转换方法的相关研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：gfpwxj

【摘要】

：

随着目前语音合成技术的进步，合成语音的音质和自然度都有了很大的提高，因此，用户对语音合成系统提出了更高的要求--多样化的语音合成，包括多个发音人、多种发音风格、多种情感以

【作者】

：

秦龙

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2007年期

【关键词】

：

说话人转换隐马尔可夫模型语音合成模型自适应

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着目前语音合成技术的进步，合成语音的音质和自然度都有了很大的提高，因此，用户对语音合成系统提出了更高的要求--多样化的语音合成，包括多个发音人、多种发音风格、多种情感以及多语种等语音的合成。在这一背景下，通过调整一个说话人的语音，使其听起来像是另一个人说出来一样的说话人转换技术被提出。说话人转换技术根据少量的目标说话人的语音数据，对源说话人的语音参数进行调整，从而得到目标说话人的合成语音，并可以此实现多样化的语音合成。为此，本文对基于HMM(Hidden Markov Model)的说话人转换技术进行了详细的介绍，并对其训练流程和关键技术进行了改进，最后，针对具体的应用进行了相应的研究。本文按照如下几个部分展开讨论：文章的第一部分主要是介绍了本文研究的背景和几种主要的说话人转换的方法。首先，简单的描述了一下语音合成技术以及其近年来的发展。接下来，为了帮助我们更好的理解说话人转换的原理，我们也对人的发音过程的声学机理和数学模型进行了系统介绍。这是因为，说话人转换技术是对源说话人的音色进行转换使其听起来像目标说话人发出的。而为了实现说话人音色的转换，通常需要对语音信号进行激励源和声道滤波器的分离，以便对激励信号和声道模型分别进行修改，然后再重新生成语音。最后我们对说话人转换技术的发展和常用的几种方法进行简要的介绍。在文章的第二部分，主要介绍了基于HMM的说话人转换的基本框架。由于基于HMM的说话人转换技术是建立在基于HMM的语音合成系统的基础上的，因此，本章首先介绍了 Tainable TTS(Text-to-Speech)的基本框架，并对其中的一些关键技术进行了分析。接下来主要介绍了基于HMM的说话人转换技术的一个重要环节--MLLR(Maximum Likelihood Linear Regression)模型自适应算法，包括MLLR算法中HMM模型均值和方差转换矩阵的估计方法以及回归矩阵绑定的基本原理。最后基于上述基于HMM的说话人转换的基本框架，进行了女到女和女到男的说话人转换实验，并且从合成语音的音质、自然度以及与目标语音的相似程度三个方面进行了主观和客观的评测实验。文章的第三部分针对第二章中所介绍的基于HMM的说话人转换的各主要技术环节，如基于MSD (Multi-space Distribution) -HMM基频建模的模型自适应、时长模型的自适应、源说话人模型的训练和选择、模型自适应算法、考虑动态参数的参数生成算法等模块；以及合成语音中的问题，如在自适应数据很少时效果不佳、合成语音频谱过于平滑等问题，分别进行了分析和相应的改进工作。主要的改进包括：整合了自适应流程，使频谱、基频、时长模型在相同的框架下进行转换；使用LSP (Line Spectral Pair) +DAL(Differential coefficients of Adiacent LSP)参数减轻频谱过平滑的问题；使用共享决策树聚类方法训练平均模型作为源说话人模型，从而提高模型自适应的鲁棒性；对模型自适应算法进行改进，提高自适应效果；针对不同的训练数据量，采用不同类型的转换矩阵；改进参数生成算法。文章的第四部分主要介绍了基于HMM的说话人转换技术在情感语音合成以及嵌入式的多说话人语音合成系统方面的应用。提出了基于HMM的情感语音合成方法，并通过主客观的测试验证了情感语音合成的有效性。另外，针对嵌入式系统中资源受限的特点，提出了一种实现多说话人语音合成的方法。

其他文献

论情境教学法在小学体育课堂中的应用

在素质教育理念的教育背景下,教师的教学思想有了巨大的进步,学生也在教师所落实有效教学方法的作用下以积极的情感融入课堂当中,懂得了主动学习使自身得到成长.因此,作为一

期刊

运用信息技术与课堂融合构建小学语文高效课堂

由于语文是我国学生的母语,语文教学属于母语教学,因此在教学的时候,语文课堂的效率相对而言比较低.在传统教育模式下的语文教学,教师的教学方法仅仅只有几样,一般而言就是朗

期刊

二维码与图像信息隐藏相结合的研究

随着因特网技术的不断进步,信息传输已经在现代社会的各个领域有了广泛的应用。为了确保信息的安全性和隐秘性,信息隐藏技术应运而生。经过二十余年的发展,信息隐藏技术已成

学位

二维码信息隐藏图像处理LSB算法DCT

编与读

电子商务不仅给企业带来了革命性的变革,而且对市场交易方式以及政府对市场的调控和监管活动也产生了深远的影响。电子商务的规范发展需要强化工商行政管理市场监管职能;电子

期刊

工商行政管理市场监管职能电子商务市场交易行为监管活动市场交易方式地域管辖企业名称网络商务立法领域

中学英语教育中的美育渗透

由于长期受应试教育的影响,很多英语教师的课堂教学大多还只停留在智育层面,在很大程度上忽视了课堂教学的美育效应。由此,笔者联想到英语教学,在英语教学中,通过渗透美育,促

期刊

化工用往复式压缩机配管设计探索

往复式压缩机是一种容积式压缩机,在化工生产中的应用广泛,同时也存在许多缺陷需要进一步改善.在设计往复式压缩机的配管部分时,应当充分考虑结构、功能需求以及安全性能等方

期刊

化工往复式压缩机配管设计

壁厚不均套管抗挤强度的数值分析

在套管的生产制造过程中会产生冶金制造缺陷,机加工缺陷以及机械损伤缺陷.而我们把生产过程中产生的残余应力,套管不圆度以及壁厚不均匀缺陷视为对套管抗挤强度的最主要影响

期刊

套管抗挤强度制造缺陷有限元分析

Study on primary carbides precipitation in H13 tool steel regarding cooling rate during solidificati

期刊

主体作用如何凸显学生的英语教学中

期刊

高中英语词汇深度教学的策略探析

人们常说:“没有语法,人们无法表达许多东西,但没有词汇,人们不能表达任何东西.”在核心素养视野下,高中英语教学词汇具有更加重要的意义.在新颁发的《高中英语课程标准》中,

期刊

基于隐马尔可夫模型的说话人转换方法的相关研究

与本文相关的学术论文