基于深度学习的变声系统的研究与实现

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:darkcome
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现在人工智能产品的普及,语音技术受到越来越多技术人员的关注。变声系统正是应用了深度学习的语音技术。对于现存的变声系统来说,大多数没有考虑到使用过程中噪声对于变声性能的影响。然而噪声在变声系统的使用过程中是不可忽视的影响因素。目前降噪的方法很多,但是神经网络的模型大小很容易超过数百兆字节,从而限制了其在变声系统中的适用性。本文将采用一种轻量级的全卷积的神经网络(FCNN)来改进带有”瓶颈”的自动编码器变声(AutoVC),提高变声系统对于带噪声语音的性能。本文的变声系统主要基于深度学习的知识来实现,可实现对含有噪声的语音进行对特定目标的变声。本文所提出的基于深度学习的变声系统中,变声包括五个步骤:用户注册或登录,直接录音或者选择要变声的语音,将语音降噪预处理,实现降噪语音的变声处理和展示变声后结果。为了提高变声系统对于噪声的鲁棒性,本文在变声系统使用了增加了语音降噪预处理模块的带瓶颈的自动编码器变声系统DNAutoVC。将输入的语音经过全卷积神经网络,全卷积神经网络由一维卷积和频率扩展的二维卷积组成,并结合了残差学习和跳过连接结构。实现了带噪语音的降噪预处理,将预处理后的语音频谱图输入到内容编码器,获得源语音中的内容信息。同时将特定的目标语音频谱输入到说话人编码器,获得目标语音的说话人信息。然后将源语音内容信息和目标语音说话人信息级联输入到解码器中最后实现变声。本系统使用B/S架构,用户不需要下载专门的客户端,通过浏览器就可以便利地实现变声。经过理论分析和测试实验,本文提出的基于深度学习的变声系统对于含噪语音的变声相对于未进行改进的带瓶颈的自动编码器变声系统性能得到了提升。
其他文献
在单层厂房钢结构设计中,保持稳定性是经常遇到的问题。从结构整体到构件再到局部板件,设计时无不涉及到稳定问题。本文分析了单层厂房纵向受力体系、纵向抗侧力体系类型、竖向荷载和水平向荷载的传力过程、纵向计算两种模型和模型计算简化依据,总结了防止构件失稳以及计算分析时的几点注意事项。
目的:利用网络药理学结合实验验证探讨阿里红(FOA)治疗阿尔茨海默病(AD)可能的作用机制。方法:借助中药分子机制的生物信息学分析工具(BATMAN-TCM)平台及公开报道的文献数据获得阿里红化学成分;利用PharmMapper药效团匹配平台和TargetNet数据库综合筛选出成分预测靶点;通过基因表达综合数据库(GEO)、Drugbank数据库等获取AD疾病靶点,取交集得出阿里红可能的作用靶点,
新业态从业人员职业伤害保障制度的完善不仅有利于保障新就业形态劳动者的权益,还有利于促进以新业态新模式为特征的新型消费迅速发展。本文从经济公平与社会公平的视角出发,既从理论上探讨构建新业态从业人员职业伤害保障制度的必要性,又从具体的制度设计层面提出构想,加快推进职业伤害保障制度建设。
区块链技术是一种采用类似于链表的方式,将数据区块通过时间顺序组成的数据结构,其中包含了非对称密码学、共识机制、分布式存储等经典的计算机基础应用。该技术作为互联网中一种新型的信任模型,解决了传统中心化机构中的高成本、低效率和数据存储不安全的问题。而共识机制作为区块链的核心技术,其任务是在高度分散的分布式系统中,保证节点对某一提议能够达成最终的一致性共识。因此,如何提高达成共识的效率是目前共识机制的研
“互联网+”经济时代的到来,企业之间竞争转向人才之间的竞争,知识型员工可以使企业在不断变化的市场环境中获得可持续竞争优势。知识型员工具有强烈的成就动机,追求自我价值的实现,在工作中可以运用知识创造价值。但随着组织规模的扩大,知识型员工在组织间的流动也日益频繁,如何帮助其获得职业成长成为组织关注的重点话题。近几年积极心理学的发展迅速,学者们开始关注个体的积极人格品质,成长型心智模式作为积极人格品质开
随着信息时代发展,数据呈现爆炸性的增长。数据可视化的实现有助于从繁杂的信息中发现数据走向,是对数据的全局俯视,能实现对数据更加精准的把握。而且网络数据量庞大且易于获取,可以更好地满足知识图谱对数据源的需求。最大效益地利用好数据源,最大限度地提取信息并进行可视化,知识图谱是不二首选,引入知识图谱对构建实体关系研究平台有着重要作用。当今对于知识图谱的研究大多集中于知识图谱的关系提取、可视化技术等。研究
长链非编码RNA(lncRNA)在许多生物的生命活动中起着非常广泛的调节作用,例如染色质修饰,细胞的分化和增值,RNA的进展和细胞凋亡等。lncRNA-蛋白质相互作用在转录后基因调控中起着重要的作用,例如剪接、翻译、信号转导和复杂疾病的进展。传统的研究过程包括靶点识别、生物大分子的发现、临床前研究、临床研究以及审批,而计算机模拟的方法则具有耗时短,成本低的优势。在本文中,采用了深度学习中的图卷积神
信息技术的快速发展,促进了各行各业产业结构的调整。在农业生产方面,信息化技术也扮演着越来越重要的角色。我国是一个人口大国,民以食为天,农业的健康发展直接关系着14亿人民的餐桌质量。智能农业大棚作为一种重要的农业生产模式之一,有效提高了大棚管理水平和农作物生长水平,是一种提高土地利用率、解决人多地少矛盾的有效方式。可以预见的是基于无线传感器网络技术的智能农业大棚是未来很长一段时间内农业大棚发展的新趋
在轧制工业领域内衡量轧制产品质量一项重要指标就是带钢出口厚度,多年来,我国钢铁在生产方面、消费方面、出口方面始终排在世界第一位,因此对带钢厚度预测的不准确不仅会影响钢材质量,还会对生产钢材的原料产生不可估量的浪费,从而对社会经济造成一定的损失。目前智能控制方法在钢铁轧制领域应用相对较少,并且对带钢厚度精度预测不够高,加上影响带钢出口厚度的因素又非常多,而这些因素对其影响呈非线性变化且程度也各不相同
无线传感器网络(wireless sensor networks,WSN)是由大量微型传感器节点部署在目标监测区域内组成的,通过无线通信形成的多跳自组织的网络系统。人类的生存离不开拥有如此丰富生态资源的森林,无线传感器网络通过高效便捷的方式对林区的温湿度、有害气体浓度信息进行实时监测,对保护自然气候与生物共存有着非常重要的意义。然而,现实中林区环境监测存在许多影响着传感器节点在数据传输时丢包的现象