基于深度神经网络的语音增强方法研究

来源 :东南大学 | 被引量 : 1次 | 上传用户：cai67716029

【摘要】

：

【作者】

：

李楠

【出处】

：

东南大学

【发表日期】

：

2019年01期

【关键词】

：

语音增强深度神经网络生成对抗网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音增强在语音信号处理系统及人工智能系统中有广泛应用。在实际环境下,传统的语音增强算法存在增强性能低、泛化性能差等问题。本文结合人耳听觉感知特性,借助近几年新兴的深度学习网络结构,研究了基于深度神经网络的单通道语音增强方法。论文主要提出以下两种算法:基于多分辨率耳蜗谱图MRCG(Multi-Resolution Cochleagram Feature)和深度神经网络DNN(Deep Natural Nets)语音增强方法,基于二维语谱图和条件生成对抗网络cGAN(Condition Generative Adversarial Nets)的语音增强算法。(1)基于多分辨率耳蜗谱图的深度神经网络语音增强算法。与传统采用短时傅里叶变换STFT(Short-Time Fourier Transform)等特征参数不同,本文算法基于Gammatone滤波器组模拟人耳的时频分析特性,提取每个时频单元的多分辨率耳蜗谱图MRCG作为频谱特征,并将每个时频单元以及前后两帧的MRCG特征进行拼接,作为包含两个隐层的DNN网络的输入特征参数进行训练,训练目标为当前时频单元的理想概率掩蔽IRM(Ideal Ratio Mask)。DNN采用均方根优化算法RMSProp(Root Mean Square Prop)来更新梯度,解决了传统网络梯度更新不稳定的问题。论文采用客观评价指标PESQ(Perceptual Evaluation of Speech Quality)和主观感受指标STOI(Short-time Objective Intelligibility)作为语音增强评价指标,实验结果表明该算法在提升PESQ上有较好的表现。(2)基于二维语谱图和条件生成对抗网络cGAN的语音增强算法。cGAN网络目前多应用于生成指定标签的图像增强和识别。本文将语音的二维语谱图作为指定标签,充分考虑相邻帧之间的关联性,提出基于cGAN的含噪语谱图到增强语谱图的映射算法。cGAN借鉴了相互对抗的博弈思想,采用原始含噪语音作为条件与随机噪声一起输入到G网络中,并且借助U-Net结构,即编码器-解码器结构进行训练,在上采样层和下采样层之间添加跳跃连接,保证了浅层特征在整个网络中的流通性。在多种噪声和不同信噪比环境下进行仿真实验后,结果表明该算法增强后的语音PESQ分值得到较大幅度的提升,同时STOI值均优于基于MRCG的语音增强方法,且对于混合人声环境下的PESQ有明显提升效果。另外,论文扩展了噪声类型,仿真结果表明该算法泛化性能较好,具有较强的鲁棒性。

其他文献

应注意正面报道的负面效应

我们常讲,新闻要真实,要可信,应该说,新闻的真实与可信这两个不同的概念,表达的本是统一问题的两个不同层面.

期刊

正面报道负面效应新闻报道新闻真实深度报道

防盗快速为Excel添加水印护身

众所周知，水印能够起到防伪防盗的作用，那么能不能把我们经常都在使用的Excel文档也添加上水印，让其既美观又防盗呢？当然可以，用背景图片就行了。不过用背景图片有两个问题，一是大

期刊

EXCEL文档水印防盗背景图片表格

李鬼卫士扫地出门

最近我和朋友都发现，自己的浏览器常常自动登录到一个上网导航网站。本以为又中了什么流氓软件，经过了解才知道这是一个名为“李鬼卫士”的木马程序变种。该木马伪装成安全辅助软件“360安全卫士”的相关文件骗取用户点击，我也正是因为这个原因而中招的。

期刊

浏览器木马程序辅助软件自动登录点击运行安全网站用户修复清除

“TPR”教学法促进低年级学生乐学英语

心理学研究表明：小学生的感知能力较差，抽象思维能力未形成，思维形式以感觉运动模式为主，模仿能力较强，学往往对新颖动作的示范感兴趣，而对老师的讲解缺少热情。国当代著名教育家，北

期刊

低年级学生英语老师教学法TPR北京外国语学院乐学抽象思维能力心理学研究

对新财会制度的几点建议

新财会制度实施的两年多来,对促进社会主义经济体制改革,为计划经济向市场经济过渡起到了积极的促进作用。我在执行中曾遇到一些问题,认为还需要进一步研究或改进,在此提出来

期刊

新财会制度几点建议企业固定资产社会主义经济体制改革流动资金市场经济计划经济资金使用促进作用仅供参考

小组学习模式在中学地理教学中应用

本文主要介绍了小组学习模式的背景、要求，阐述小组学习模式在中学地理教学中应注意的事项。

期刊

中学地理教学小组学习模式背景要求与事项

Outlook邮箱邮件附件管理法则

如果平时惯用Outlook收、发邮件的话，在收件箱中可能有很多邮件附件，要想打开这些附件，只有先找到并打开这封带附件的邮件，才能看到相应的附件。其实，要想打开Outlook中的附件，有两

期刊

OUTLOOK附件管理邮件附件法则邮箱收件箱

基于柔性表皮电子的心电监测系统

目前,随着国民生活水平的日益提高和经济的快速发展,越来越多的人开始关注自身的健康状况。近年来随着社会老龄化进程日益加快,青年人的生活压力越来越大,作息不规律等现象的

学位

心电监测柔性电子磁电复合材料可穿戴

沈阳市药物中间体制造项目招商

沈阳市药物中间体制造项目招商沈阳市凤辉生物化学制药厂，位于东陵区旧站路１３５号，１９８９年建厂，占地面积７０００平方米，建筑面积３８００平方米，现有固定资产６９８万元。该企业工程技术力量雄厚，产品品种较多，资源

期刊

药物中间体薯蓣皂素项目招商投资回收期投资估算制银灵片化学制药厂销售市场市场预测人工牛黄

拔开笼罩消费者心中的乌云——新余市供销大厦售出一份商品、履行一份责任、奉献一份爱心

怎样才能适应顾客,让消费者满意?这是在今天的市场经济中,让众多的商业企业苦心思索的问题。众所周知,商业企业的竞争无非在两个质量上,即商品的质量和服务的质量,两者相互关

期刊

商业企业消费者满意新余市商品质量供销质量关顾客投诉市场经济经营管理市场竞争

基于深度神经网络的语音增强方法研究

与本文相关的学术论文