基于深度学习的复杂背景下的语音增强算法

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:yiyiyaya13575
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的语音增强算法通常基于平稳噪声的假设,在复杂的背景下常常失效。基于深度学习的增强算法能很好地抑制非平稳噪声,但在不匹配的噪声环境下也出现性能下降。而提高模型的泛化性能需要大量的数据,这意味着更多的时间和计算资源。与现有技术相比,生成对抗网络(Generative adversarial network,GAN)被用于处理语音增强问题,经过网络架构的优化,可利用适量的训练数据以及常见的计算资源,构建在低信噪比及复杂噪声背景下通用的端到端模型。现有的大多数技术基于傅里叶分析,通常忽略相位信息而直接使用带噪语音的相位重建增强后的语音,这不利于提高低信噪比下的语音质量。利用生成对抗特性,在原始波形水平上操作,尝试利用波形中的细粒度信息(如相位、对齐等),可提高增强语音的质量,同时,由于卷积神经网络共享权值的特性,可实现更高的训练效率和更快地增强过程。优化后的模型相对于原始模型,在客观评估上得到了更为优异的效果。相对于基线DNN模型,具有与其竞争的性能,且更好的泛化性能。主观评估的结果表明,在所给定的特定的现实背景下,GAN得到了更多听众的偏好。
其他文献
【摘要】:随着互联网+时代的到来,传统的课堂教学,在计算机多媒体等现代教育手段的充分利用下,呈现出大容量、大数据、大信息的特点。学生的学习兴趣、课堂的教学效率等得以大幅度增强和提高。传统的语文课堂在声光影的展示中,显现出新的活力。  【关键词】:多媒体教学;语文;兴趣;课堂效率  【中图分类号】G633.3  互联网+时代的到来,促使多媒体教学在语文教学中广泛运用,处于新课改形势下的语文教师,既要
以焦化废水"三膜法"深度处理工艺产生的实际高电导率纳滤浓盐水为研究对象,考察不同PH值、Fe2+和H2O2条件下"芬顿法"去除焦化纳滤浓水中COD及TN的效率。
在考察InGaAs p-i-n管对锁模激光响应的实验中,发现其响应电压在经历一个快速的上升沿和缓慢的拖尾以后有一个明显的负电压.在二极管的线性响应阶段,负电压与正电压的峰值之
在全球广泛采用移动支付的今天,移动电话已经成为一个通用和自主授权使用的通信工具。一些市场在实现市场力量和消费者接受的正确组合方面取得进步。移动商务或(M-commerce)
《三国演义》从江户年间传入日本后,由于它具有独特的魅力,因此受到了日本的高度欢迎,以至于在日形成了多次“三国”热潮。“三国”被日本群众所接受的同时,日本文化也在潜移
研究了氢氟酸(HF)湿法刻蚀石英玻璃的化学机理,探索了针对衍射光学元件制作的刻蚀工艺,得到相关实验规律和工艺参数.最后对实验误差进行定量分析,得到湿法刻蚀的可控精度.
高速动车组齿轮减速箱内部油气压波动很大,运行环境(列车交会、出入隧道等)比较恶劣,车体表面会有很大负压产生,造成齿轮箱内外压差很大,最终润滑油在压差的作用下泄漏到齿轮
针对焦炉煤气制氢装置在运行过程中存在的问题,分析查找了原因并对其采取改进措施,降低精制工序阀门故障影响装置正常运行,保证了安全生产。
模块化箱式房是一种可移动、可重复使用的建筑产品,作为模块化箱式房屋中最早期以及最具代表性的一类结构形式,集装箱房屋具有低成本、高强度、高装配性等显著优势,有助于我国建筑产业化、标准化和装配化政策的深入贯彻实施。但就目前的发展形式看,对于集装箱房屋的研究多停留在建筑层面或只针对单个箱体,现存的模块化集装箱式房屋大多仍是低层房屋,对多层模块化箱式房屋结构体系的研究缺乏相应的理论研究与工程实践。为探究多
近年来,位于二连盆地的巴音都兰凹陷持续加大勘探投入,但在陡坡带及缓坡一直未取得大的突破,使油气勘探工作处于徘徊状态之中。前人在海相及较大型的陆相断陷湖盆层序地层及对沉积体系的控制作用的研究相对成熟,但对类似于二连盆地发育的这种受多种因素影响的陆相小型断陷湖盆的层序发育模式及控制因素研究相对薄弱。本文在层序地层学等理论方法基础上,利用该区3D地震大连片处理资料和钻井、录井、测井、测试资料,开展井—震