基于嵌套U型网络的语音增强深度学习模型研究

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:gonggong1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的深入发展,语音技术的智能化也取得了飞速的进步,而语音增强技术作为智能语音领域的必需环节,被广泛的应用于助听器以及智能语音助手等场景中。由于传统的语音增强方法不仅需要去假设噪声的统计分布,还会忽略相位信息的影响,这就导致了传统方法存在着对噪声敏感以及泛化能力不强等问题。针对以上问题,本文研究了基于嵌套U型网络(nested U-shaped network,U2Net)模型的语音增强方法,主要研究工作与成果如下:(1)阐述了语音增强以及U型网络(U-shaped network,UNet)模型的相关理论,并提出了一种新的U2Net模型框架。首先介绍语音感知的特性,并回顾了一些经典的传统语音增强方法与及基于深度学习语音增强算法的相关理论;然后阐述用来评价语音增强性能的指标并论述了UNet模型的相关理论,包括有UNet模型框架以及基于UNet的衍生模型研究概述;最后根据UNet模型存在的不足,提出一种更适用于语音增强任务的U2Net模型。实验表明,采用了U2Net模型的语音增强方法能够更有效的解决语音增强问题。(2)提出了基于通道注意力U2Net(Squeeze-and-Excitation U2Net,SE-U2Net)模型的时频掩蔽语音增强算法。该方法在U2Net模型的基础上,融合了通道注意力机制(SE机制)与时频掩蔽算法,使得增强模型拥有了选择输入特征的能力,能够有效的提高目标语音的显著特征并抑制噪声的特征,从而提高语音增强的效果。实验结果表明,相比于传统方法与基于深度学习的方法,提出的方法能够对多种环境下的含噪语音实现更好的增强效果,并且可以有效的改善语音听觉质量以及提升语音可懂度。(3)提出了基于复数U2Net(Complex-U2Net)模型的复值掩蔽语音增强算法。该方法在U2Net模型的基础上,通过结合复数卷积神经网络与基于极坐标的复值掩蔽算法,直接将含噪语音的复数谱作为模型输入,从而避免了语音增强过程中出现相位失真的问题,使得增强语音更接近于纯净语音。多种噪声环境下的实验表明,相对于其他基于深度学习的语音增强算法,提出的方法可以在一些噪声条件下实现更好的语音增强效果,尤其能够在强噪声环境下有效改善语音听觉质量并提升语音可懂度。
其他文献
报纸
为促进麟凤兰幼苗生长,以进口麟凤兰种子为材料,比较两种叶面肥对麟凤兰播种苗生长的影响,筛选适宜的使用浓度。结果表明,叶面肥奥西沐和萃升沃根对麟凤兰幼苗在营养钵中的生长均有促进作用,奥西沐的最佳使用浓度为稀释1 600倍液,萃升沃根的最佳使用浓度为稀释600倍液。当使用奥西沐稀释1 600倍液喷施麟凤兰幼苗7次(2周1次)后,其叶片宽度、根长、根粗、苗重为所有处理组中最大,分别较对照处理增大0.39
期刊
近年来,利用光催化技术去除持久性有机污染物受到了广泛关注,对光催化剂的开发和利用逐渐成为广大学者的聚焦所在。由于石墨相氮化碳(g-C3N4)可以直接吸收可见光,且物理化学性质稳定、无毒无害、来源广泛,所以可将其应用于光催化。但纯的g-C3N4光生电子空穴易复合,影响了其可见光催化效率。对g-C3N4掺杂改性是一种行之有效的方法,本文将Bi2MOO6(BMO)和Bi OBr分别与g-C3N4进行耦合
学位
电接触材料是隔离开关电器系统工作中的关键,而常用作电接触材料的普通镀银层存在质地软、不耐磨、耐蚀性差等缺点,影响了隔离开关电器系统的可靠性和使用寿命。本文采用复合电沉积的方式,将石墨烯作为增强相引入银基体,以期得到性能提升的复合镀层,从而提高隔离开关系统的服役寿命。首先对5,5-二甲基海因(DMH)无氰镀银体系的工艺进行完善,筛选出合适的添加剂及用量。在此基础上,制备出银-石墨烯复合镀层,并对石墨
学位
电化学阴极还原技术在大多数重金属离子去除和回收的应用较为广泛。然而在电化学去除含三价锑(Sb(III))的废水中,阳极氧化技术的研究更为常见,阴极还原技术的研究相对较少,尤其是在还原机理和回收产物的高值化方面未见有过研究。因此,本文开发了一种电化学阴极还原技术,通过构建碳布(CC)和钯负载碳布(Pd/CC)阴极电极材料,实现废水中Sb(III)的去除和回收。通过直接电化学还原和原子氢(H*)介导间
学位
由于信息技术的飞速发展,以至于海量的信息量产生与传播,人们每日都面对大量的信息,因此,人们想要快速准确找到自己所需的信息不再是轻而易举的事情。基于此问题,人们提出了推荐系统,其中协同过滤推荐算法是推荐算法中应用较广泛的一种。Slope one是协同过滤推荐算法的一种,本文基于slope one算法,融合数据的特征信息,提出了两种算法,一种是融合矩阵分解和评分信息的改进协同过滤推荐算法(MPSCF)
学位
<正>黎元洪(1864-1928),字宋卿,武汉黄陂人,1883年考入天津北洋水师学堂。1888年入海军服役。1894年,参加中日甲午海战。战后投靠署理两江总督张之洞。1911年武昌首义时,被推举为湖北军政府都督。1916年袁世凯死后,由民国副总统继任总统。1922年,他在直系军阀支持下复任总统。1928年6月3日,在天津去世。
期刊
元宇宙作为全球资本角力的新一代沉浸式互联网,将物理世界映射到数字空间之中,将深刻改变人类社会的行为模式与存在形态。目前对于元宇宙的规制缺乏统一标准,对其空间的治理需匹配相应的治理手段与能力,以适应数据作为基础性生产要素的空间发展逻辑。数字人民币作为拥有技术优势的数字化法币,相较数字代币具有币值稳定、规模优势与以国家信用为背书的优点,以适应元宇宙下跨境跨空间支付体系建设与监管的客观需要。当前围绕技术
期刊
传统燃油汽车以石油作为动力来源,大量的尾气排放不仅对环境产生了严重的影响,同时也威胁到人们的身体健康。近年来,由于大气污染带来的全球气候问题和能源短缺问题进一步加深,各国开始大力推进新能源电动汽车的发展。新能源电动汽车避免了汽车尾气带来的环境问题的同时也减轻了传统汽车对不可再生能源的高度依赖。电机作为电动汽车的直接动力输出,是否拥有良好的性能对电动汽车的安全性和运动品质至关重要。永磁同步电机(PM
学位
报纸