歌唱人转换研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:deathzdw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号中包含有语义信息和和个人身份信息。所谓说话人语音转换就是在保持语义信息不变的情况下,改变说话人语音中包含的个人身份信息,使其听起来像是另一个指定的人在说话。说话人语音转换通常通过改变说话者的音色与音高等发音特征来实现。到目前为止,科研工作者己经在这方面做了大量的工作,形成了一些有较高成熟度的语音转换技术。然而,虽然和语音转换存在着千丝万缕的联系,歌唱人转换问题却鲜有人涉及。究其原因,主要是因为相比于语音转换,歌唱人转换专业性更强、难度更高。在上述研究背景下,本文对歌唱声转换这一课题进行了深入研究,开发了若干歌唱人转换算法,并在此基础上构建了一个歌唱人转换系统。本文的主要工作和创新点如下:1.为了实现歌唱人转换,首先请专业的音乐工作者(称为源歌唱者)录制了一个歌唱数据库。此外,为了提取希望生成的目标歌唱人的声音特征,同时也是为了评价所提出的歌唱人转换算法的优劣,还录制了目标歌唱人的歌唱数据库。录制时要求录制人员尽量按照乐谱上的音高来演唱以最大限度地抑制不同歌唱者在音高上的差异给歌唱人转换算法带来的不利影响。一共录制了时长约132分钟的中文歌声,为歌唱人转换提供了可靠的数据来源。2.传统的转换语音合成方法因为在基频提取和激励信号生成方面存在一定的问题,使得所生成的转换语音质量较差。为了解决这一问题,本文采用梅尔对数频谱近似(Mel Log Spectrum Approximation,MLSA)滤波器对源歌唱人的声音直接进行滤波的方法来获得目标歌唱人的歌唱声音。实验结果表明,所述方法可以取得比较理想的歌唱人转换效果。3.基于高斯混合模型(Gaussian Mixture Model,GMM)的转换方法是一种较好的方法,但该方法在训练数据不足时存在过拟合现象。而在实际应用中由于目标歌唱人的歌唱样本较难采集,其可用于训练的歌唱样本数往往偏少。为了解决这个问题,提出了一种结合核模糊聚类和偏最小二乘回归(Partial Least Squares Regression,PLS)的歌唱人转换方法。实验结果表明,该方法在训练数据较少时,可以取得优于GMM方法的歌唱人转换效果。
其他文献
谢晋在新中国成立之际涉足电影界,从事导演的工作,在超过五十年的创作生涯里,创作出多部经典电影,成为"中国观众最多的导演"。政治主流意识形态的体现是其在中国电影史上赫赫
<正> 1工程概况 道平拉河闸工程上游流域面积780km~2,多年平均径流量1.57亿m~3,一次可拦蓄水量80万m~3;与下游橡胶坝联合运用,可向市区日供水1.5万m~3,灌溉农田333.5hm~2,年
金属负载型催化剂在许多精细化学品生产中具有重要应用。近年来,生物柴油作为绿色可再生能源受到人们广泛关注,在生物柴油的生产过程中会产生大量的甘油,将过剩的甘油转化为
中国现行的蛋鸡舍内CO2浓度控制的农业行业标准为1 500 mg/m3,主要适用于传统的刮板式清粪鸡舍。目前新建、改建鸡舍都采用传送带清粪方式,鸡舍内的相对湿度和氨气等有害气体
本文分析内环处精索内静脉结扎、腹膜后精索静脉高位结扎及精索内静脉腹壁下静脉或腹壁浅静脉分流术三种术式,就其术后症状和体征消失或改善、精液常规、内分泌检查及术后并发
Y型分子筛是催化裂化(FCC)的速率控制组分.FCC过程中,催化剂在反应器和再生器中往往面临高温水蒸气存在的苛刻环境.因此,分子筛的热稳定性和水热稳定性是催化剂最为关注的性能
<正>在不等式的相关问题中,"切线法"是一个基本方法.其思想本质是利用直线(即切线)将原来的复杂变量变为一次的式子.一、"切线法"的基本运用使用"切线法"的基本原则:对于涉及
作业是课堂教学的延伸和补充,如果局限在再现式的范畴内,就会既没有思维训练价值,更谈不上创新精神与实践能力的培养。为切实减轻教师和学生的课业负担,我们在全校试行“作业超市
目的:观察不同时期电针少阳经穴对偏头痛大鼠的行为学、50%缩足阈值(50%PWT)及血清中内皮素(ET)、一氧化氮(NO)、降钙素基因相关肽(CGRP)含量的影响,为临床运用针灸治疗偏头
原发性肝癌是我国常见的恶性肿瘤之一,全世界每年新发的肝癌患者约45%发生在我国大陆地区,而且近年来发病率又有增高趋势,统计表明我国肝癌的年死亡率为20.40/10万,在城市和