个性化语音生成研究

被引量 : 0次 | 上传用户：niubisile

【摘要】

：

个性化语音生成是指生成具有特定说话人特征的语音。个性化语音生成的应用非常广泛,比如可以改变语音合成系统的语音以提供个性化的合成语音,或在语音聊天、在线游戏中隐藏说

【作者】

：

双志伟

【发表日期】

：

2011年期

【关键词】

：

个性化语音生成说话人转换语音合成共振峰频谱弯曲模型自适应多语言

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

个性化语音生成是指生成具有特定说话人特征的语音。个性化语音生成的应用非常广泛,比如可以改变语音合成系统的语音以提供个性化的合成语音,或在语音聊天、在线游戏中隐藏说话人的真实身份,也可以在多媒体彩信中模仿他人以达到娱乐的效果等。目前最常用的个性化语音生成方法有两种:一是说话人转换方法二是语音合成模型自适应方法。两种方法有着各自的优缺点,适用于不同的应用场合。本文对这两种方法的特点和联系进行探讨,针对不同方法存在的问题和应用的实际需求进行改进,并通过系统评测验证了改进的效果。论文包括五部分内容:在第一部分,论文将对个性化特征、个性化语音生成的实际需求以及不同个性化语音生成方法的特点和使用场景进行总结分析。首先对人的发音过程的声学机理和数学模型进行了简要介绍,在此基础上总结了不同的说话人特征参数。然后对个性化语音生成的实际需求进行分析,并对个性化语音生成方法的优缺点和适用场景进行讨论。在第二部分,论文则是对最常用的两类说话人转换方法:基于GMM的方法和基于码本映射的方法,进行一个系统的分析。论文首先介绍GMM方法以及几种最重要的分支。接下去,对Abe的经典码本映射方法以及Alsan提出的STASC码本映射方法进行介绍。之后,论文将对这两种方法进行一个系统的分析比较,指出各自的优点和不足。最后,将讨论在实践中发现的GMM方法和码本映射方法存在的两个共同的问题:1.源和目标说话人对应数据的不匹配问题;2.转换频谱的过平滑问题。这些分析和讨论将指引本文探索新的说话人转换方法。论文在第三部分,针对现有说话人转换方法存在的问题,提出了一种基于频谱弯曲的说话人转换方法,其中频谱弯曲函数是基于源说话人和目标说话人的映射共振峰参数生成。这种方法有两个优点:一是所需训练数据非常少。二是转换语音具有较高的音质。为了进一步提高与目标说话人的相似度,论文提出了一种结合频谱弯曲和单元挑选的说话人转换方法以提高频谱细节上的相似度。该方法首先进行频谱弯曲,然后将弯曲后的频谱作为目标进行单元挑选。接下去将部分弯曲后的频谱用挑选到的目标说话人的真实频谱进行替换,最后重构出转换后的语音。评测结果表明,基于本文的频谱弯曲方法获得的转换语音音质远优于其他方法,并且在音质和相似度上取得较好的平衡。评测结果同时表明结合频谱弯曲和单元挑选可以比频谱弯曲获得显著的相似度提高。论文在第四部分,针对多语种语音合成系统遇到的实际问题,创新性地利用语音合成模型自适应和说话人转换方法相结合的个性化语音生成实现多语种语音合成系统。当今社会,中英文混合的文本越来越多。为了保证合成语音的自然连贯,通常要求中英文混合的文本内容用一个声音合成出来。然而,由于很多中文发音人的英文并不专业,直接用这种不专业的英文训练出来的模型合成的英文听起来会很不自然。这里,我们提出使用个性化语音生成方法借助一个英文母语发音人的模型,以获得更自然的中文说话人音色的英文合成语音。在使用最大似然语音合成模型自适应修改频谱模型的同时,我们利用说话人转换的韵律调整对韵律模型进行修改以获得更自然的合成韵律。评测结果表明,这种方法可以得到比其他方法更为自然的合成语音和一致的中英文音色。值得一提的是,该系统已被应用于2010年上海世博会官方网站,以帮助弱视人士聆听网站内容。第五部分将对本文进行总结,并对下一步的工作进行展望。

其他文献

顶吹转炉炼钢辅助决策系统研究

本文研究的课题是浙江省公益技术应用研究项目──“基于数据驱动的钢铁生产流程仿真技术研究与系统开发”项目。针对江苏永钢集团炼钢分厂5座50吨转炉目前存在炼钢自动化程

学位

转炉炼钢终点控制RBF神经网络量子微粒群优化算法

方钢管相贯节点转动刚度研究

采用非线性有限元软件ANSYS(6.1)对方钢管Y型相贯节点在平面内弯矩作用下的转动刚度进行数值分析,分析了影响方钢管相贯节点弹性转动刚度的主要影响因素,并采用回归分析得出

期刊

节点转动刚度数值分析回归分析

基于国际技术转移的中国技术市场发展研究

技术市场是创新型国家的重要组成部分,和发达国家相比,我国技术市场发展相对滞后,尤其是国际技术转移方面远远不能满足需要,因此从外部提高我国国际技术转移绩效,从内部完善

学位

国际技术转移技术市场影响因素供求机制案例

检测大鼠血浆游离DNA的定量PCR方法的建立及意义

目的:过度训练是体育界非常重要的问题,目前用多个指标的综合评定来判断是否有过度训练,尚无灵敏、特异的监控指标和简便的评价方法。本文建立检测大鼠血浆游离DNA(cell free

期刊

血浆游离DNA过度训练睾酮皮质酮大鼠肌酸激酶

出入古典与现代审美间的浪漫绝句——苏曼殊诗论

七言绝句是清末民初诗坛的苏曼殊享誉最多的诗体。苏曼殊诗无论表达唯心任运的禅境诗心、抒写潭影疏钟里的国族关怀或描摹现代情僧"袈裟和泪"的爱情体验,都体现出"灵、动、新

期刊

苏曼殊绝句古典现代审美

服务型政府公众满意度调查实证分析——以合肥市为例

公共服务满意度是衡量服务型政府的重要指标,而指标体系的系统性和科学性离不开准确有效的公众满意度评价数据。本文选取有代表性的指标对公众满意度进行实证分析,在此基础上

期刊

公共服务满意度指标体系

地铁火灾研究综述(续)

期刊

subway fireburning performancesmokehuman evacuationfire detection

宝洁的宝中之宝——市场调研

<正> 美国宝洁公司,是全球一家很大的日用消费品制造商和经销商,制造并经销的300多个优质品牌,畅销世界140多个国家与地区。1998年4月,宝洁公司在华经营满10周年。10年来,宝

期刊

宝洁公司市场调研广告宣传

顾客满意及顾客忠诚影响因素分析

随着运营商重组,3G牌照的发放,我国无线宽带市场迅速发展。由于各运营商所采用的3G技术制式不同,不同运营商的优势不同,采取的战略规划和营销策略不尽相同。在这样一个竞争激

学位

感知价值顾客满意顾客忠诚SEM结构方程模型天翼无线宽带

飞行训练品质评估系统的研究

国内外民用航空公司普遍重视飞行员操纵品质的监控,通过改进和完善飞行机组人员的操作水平,提高飞行安全的记录。各航空公司针对不同的机型制定了相应的飞行员操纵品质监控项

学位

模拟机品质监控项目飞行参数可执行指令码

个性化语音生成研究

与本文相关的学术论文