基于深度学习的普通话歌声合成的研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:YIFEIFEI
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
歌声在表达情感、舒缓心情等方面有重要作用。用计算机合成歌声可以创造声音独特的虚拟歌姬,为科幻动画中的人物做歌声配音,实现已故歌手音色的歌声演唱,也可以帮助缺少教师资源的地区展开歌唱教育。由于在基于隐马尔科夫模型(Hidden Markov Models,HMM)的歌声合成中,使用最大似然准则或最小均方误差准则合成的歌声存在统计平均效应,导致歌声合成结果过平滑、合成音质差,并且合成所用时间长。本文针对这些问题,用三种方法来合成歌声,改善了合成的效果。本文的主要工作如下:1.构建歌声数据库。本文选择100首歌曲曲目,共约300分钟。请1名专业歌唱者在专业录音环境中进行100首歌曲的歌声录制,录音格式为48k Hz采样率,16bit精度。接着将录制的歌声切分成完整的短句,校对、检测后得到1560句8~15s的句子。用Praat对短句做起止时间的标注。再将乐谱中的歌词转换为计算机易处理的拼音,经过校对后对乐谱进行分析,得到上下文相关标注。2.实现基于深度神经网络(Deep Neural Networks,DNN)的歌声合成。从构建的歌声数据库中提取声学特征,用DNN模型对歌声的颤音、时延进行建模训练。将得到的歌声做评测,得到平均2.68的MOS评分。3.提出基于生成对抗网络(Generative Adversarial Network,GAN)的普通话歌声合成。从构建的歌声数据库中提取模型需要的声学特征,使用GAN中的生成网络生成歌声,通过判别网络判断合成效果。该过程使传统最小生成损失和欺骗判别网络的对抗损失的加权和最小化,也就是最小化了生成样本和自然样本参数间的差距。经过多次的生成网络和判别网络的更新训练,得到合成歌声。对歌声做评测,得到平均3.05的MOS评分。4.实现基于Fast Speech的歌声合成。从构建的歌声库中提取音素、持续时间和音高特征,先后送入编码器、解码器进行处理,最后将得到的声学特征通过声码器合成出歌声。将合成的歌声做评测,得到平均3.45的MOS评分。
其他文献
内毒素又称为细菌脂多糖(Lipopolysaccharide,LPS),是革兰氏阴性菌细胞壁外膜中的重要组成成分,其对于提高细菌质膜的稳定性和保护菌株免受外界不利因素的影响发挥着重要的作用。然而,当细菌发生自身溶解、人工方法破坏细胞结构或者细胞活跃生长繁殖时,质膜中的LPS便会被释放出来。作为一种致病成分,LPS能够引起机体内毒素血症,严重者发生感染性休克、多器官功能衰竭和弥漫性血管内凝血等临床症
植物的根茎深埋于地下,受限于土壤的不透明特性,在农业科研领域难以观察其生长分布情况。在地下根茎类经济植物的采挖作业环节中,也因为难以获知其地下准确的生长位置与深度,导致整个采挖过程效率低下且准确率差,造成人力物力成本的巨大消耗。当前已有的X射线、核磁共振、探地雷达等地下植物根茎探测技术,因为存在着辐射、设备体积大、成本高、操作复杂等问题,尚无法满足于田间采挖作业时位置与深度探测的需求。为了寻找一种
抗苗勒氏管激素(Anti-Mullerian hormone,AMH)是由雄性睾丸支持细胞和雌性卵巢颗粒细胞分泌的一种仅在性腺中表达的糖蛋白,是TGFβ超家族(Transforming growth factor beta superfamily,TGFβ超家族)配体成员。在雌性动物中,AMH由卵巢颗粒细胞分泌,作用原始卵泡,防止卵巢储备过早耗尽。AMH基因在哺乳动物中研究较多,在家禽方向研究甚少
女贞子Ligustri Lucidi Fructus(LLF)为木犀科植物女贞Ligustrum lucidum Ait的干燥成熟果实,味甘、苦,性凉,归肝、肾经,具补肝肾、强筋骨、明目的功效,主治阴虚内热、腰肢无力、肾虚滑精、视力减退。研究表明,女贞子主要含有萜类、脂肪酸、黄酮类和挥发油类等化合物,具有抗氧化、免疫增强、促生长及改善肉、蛋品质等作用。本试验进行了女贞子提取物制备工艺优化和质量控制
一方面,随着我国工业的快速发展,化石燃料的消耗持续增长,有很多有毒有害的挥发性有机物(VOCs)产生,随之而来的雾霾天气、温室效应、臭氧层破坏等问题日益严重,同时对有毒、易燃和易爆气体进行高效且精确的检测也引起了人们的极大关注,因此制备新型气敏传感器迫在眉睫;另一方面,气敏传感器的传感性能与纳米材料的形貌、尺寸和分散性等密切相关,尤其是三维结构(3D)的材料,由于3D结构能够提供高效的比表面积,从
反刍动物妊娠成功率低在世界畜牧业中普遍存在,也是畜牧业发展中亟待解决的问题。妊娠成功的关键在于早期胎儿与母体关系的建立,即胚胎附植与胎盘形成。附植过程中,胎儿绒毛膜分泌干扰素τ(Interferon tau,IFNτ);附植结束后,绒毛膜细胞入侵子宫内膜、形成胎儿胎盘与母体胎盘紧密联系形成胎盘与母体完成连接。DBNL(Drebrin-like adaptor,DBNL)一种F-肌动蛋白结合蛋白,通
语义分割是对图像中的每个像素点进行类别划分,是计算机视觉领域中一个十分活跃的研究课题,在机器人感知、自动驾驶、视频监控、场景理解等方面有着广泛的应用。近年来,由于深度学习方法在各类视觉任务中卓有成效,已有大量的工作致力于利用卷积神经网络来构建语义分割模型。而目前的语义分割模型普遍是以提高分割精度为主,这导致模型存在计算复杂度高、占用内存大的问题,难以在硬件存储和计算力有限的嵌入式平台部署。因此,本
1909年,Marsh首次研究证实疯草病与采食某些棘豆属和黄芪属植物有关,随后Molyneux等发现苦马豆素(Swainsonine,SW)是疯草类植物引起动物中毒的唯一毒素。目前研究表明,苦马豆素主要由真菌产生,而有关苦马豆素的生物合成通路及调控其合成的催化酶基因尚不清楚。鉴于此,本研究以金龟子绿僵菌为试验材料,采用同源重组和RNAi技术对疑似催化酶基因PKS进行敲除和干扰并进行功能验证,旨在探
随着人工智能技术的飞速发展,移动机器人作为人工智能的重要发展方向之一,正以前所未有的速度发展革新。在移动机器人关键技术研究中,由于各种工作任务下对机器人定位精度要求的不断提高,需要机器人达到高精度的定位,以满足任务的要求。本文研究分析了多传感器融合结合扫描匹配的移动机器人定位算法,以机器人操作系统(Robot Operate System,ROS)为平台,针对单传感器定位的局限性和复杂环境下定位精
牛结核病是一种人兽共患传染病,其主要病原为牛分支杆菌(Mycobacterium bovis,M.bovis)。由于缺乏高效疫苗,牛结核病在没有足够资金支持的发展中国家仍未得到有效防控。天然抗性相关性巨噬细胞蛋白1(Natural resistance-associated macrophage protein 1,NRAMP1)基因对巨噬细胞激活通路具有多效性作用,并可抑制多种胞内寄生菌的感染,