基于注意力融合卷积神经网络的语音增强算法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:wjkylin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强技术的目的是净化被干扰源破坏了的带噪语音,恢复出干净的说话人信号,在此过程中保证语音信号的质量和可懂度是本领域学者不懈追求的目标。目前基于数字信号处理技术的传统语音增强算法在周围环境变得恶劣或者不再满足设定条件时,会产生严重的噪声残留或者语音失真致使听力设备无法工作。为了解决上述问题,近年来基于深度学习的语音增强算法开始兴起,能够在极低信噪比和复杂背景下恢复出干净语音,取得了令人瞩目的成绩。其中,卷积神经网络能在保证去噪效果的前提下大幅减少模型的参数量,得到了研究人员的广泛关注。然而,卷积运算的感受域有限,很难对全局语境进行建模,这限制了模型进一步提升的空间,不利于增强语音的恢复。为了解决上述问题,本文主要研究通过注意力机制提高卷积网络获取全局语境的能力,进一步提升语音增强的性能。本文先是提出了一种用于单通道语音增强的注意力强化全卷积神经网络AAUNet,将一种二维相对自注意机制应用到全卷积网络中,具体做法是将卷积运算与注意力机制产生的输出在通道方向拼接起来生成新的特征图,通过调整注意力通道所占的比例,可以在卷积关注局部细节和自注意力获取全局语境之间找到最优组合。实验结果表明,AAUNet在多种未知噪声和信噪比条件下超越了所有对比方法,提高了模型的去噪能力。然而,本文在实验中发现,当注意力机制的通道数占比为100%时,模型的语音增强性能出现了下降,针对这一问题,本文又提出了一种基于独立自注意机制的语音增强模型SAUNet。独立自注意机制可以自由设置运算区域的大小,通过多值矩阵提升基于距离的感知能力。实验结果表明,SAUNet相比于AAUNet需要的参数量更少,且在PESQ和STOI评估指标上分别提高了 7.93%和4.16%,对语音质量、可懂度和未知噪声抑制等方面的性能提升更加显著。
其他文献
[目的]为叶用银杏的氮肥管理提供参考.[方法]采用盆栽试验,以2年生半同胞家系银杏苗为试验材料,在银杏生长高峰期(5月下旬)施加不同水平铵态氮(0、1、2、4 g/盆),于8月下旬分别测定银杏单叶干质量、单叶面积、比叶干质量、光合色素含量、硝态氮含量、铵态氮含量、硝酸还原酶活性、氮磷钾含量、黄酮醇苷类成分及总黄酮含量,筛选有利于银杏叶片生长、生理代谢和品质提高的外施铵态氮水平.[结果]外施铵态氮水平显著影响银杏叶片的生长、生理和品质,每盆外施铵态氮水平为2 g时,单叶面积、单叶干质量和比叶干质量均达到最高
近年来,随着人类科技的不断进步,各类电子设备也越来越频繁地出现在我们的生活之中,而在这个过程中电路板正发挥着不可替代的作用。手机、笔记本电脑、数字相机等电子产品的普及对电路板的轻便性和可靠性提出了挑战,传统的印制电路板已经不能满足用户们日益增长的消费需求。柔性电路板(Flexible Printed Circuit,FPC)成为电子产品微型化和移动要求的最佳解决方案。FPC本身材质脆弱且工艺复杂,
近年来,得益于5G时代下高速率、低时延等通信特性的支持,作为空中用户接入到现有蜂窝网络的无人机,即网联无人机,在农业植保、勘探巡检等多个领域都受到了广泛的关注。由于无人机自身计算能力有限,边缘计算技术被创新性地应用于网联无人机通信系统,无人机可以将自身任务卸载到装备了边缘计算服务器的地面基站进行远程计算,以应对实时观测、视频识别等计算密集型任务。对于利用边缘计算的网联无人机通系统,如何规划无人机轨
场发射扫描电子显微镜由于专业性和有效性,已成为医学和材料科学领域的基础研究工具。但是,场发射扫描电子显微镜仍然存在着两个方面的问题,一方面是其核心器件的研发周期长,成像放大倍数很难进一步提高;另一方面场发射扫描电子显微镜的分辨率与其视野之间存在着固有的内在矛盾。为了解决以上问题,我们将超分辨任务引入电子显微镜领域,提出了两种基于深度学习的超分辨算法作为电子显微镜的辅助方法,同时获得较大的视野和超高
[目的]利用测序获得的竹叶花椒Zanthoxylum armatum转录组数据,研究竹叶花椒中MYB转录因子家族的序列信息、进化模式、表达模式,探寻此家族中参与竹叶花椒皮刺生长发育的相关基因,为进一步揭示MYB转录因子家族生物学功能提供理论依据,为后续的无刺竹叶花椒品种的基因工程培育奠定理论基础.[方法]利用生物信息学方法,从测序获得的竹叶花椒转录组数据库中筛选MYB转录因子,对其蛋白基序、理化性质、系统进化关系、基因表达特性等进行分析,并利用qRT-PCR技术和基因克隆,对所选基因进行验证.[结果]从竹
[目的]为辣木组织培养再生体系的建立提供参考.[方法]以辣木叶片、茎段和花药为外植体,采用酶联免疫吸附法(ELISA),在其愈伤组织诱导和分化阶段的0~28 d内,每7 d取样1次,测定吲哚乙酸(IAA)、脱落酸(ABA)、玉米素(ZT)和赤霉素(GA3)含量,分析了4种内源激素含量及其比值的动态变化,探讨植物内源激素与辣木愈伤组织诱导分化的关系.[结果]叶片、茎段和花药最早形成细胞团分别为培养14、7和21 d时.在辣木叶片、茎段和花药愈伤组织诱导和分化阶段,IAA和ABA含量处于高水平,ZT和GA3含
[目的]为了研究枣园土壤养分与枣果营养品质间的复杂关系,制定土壤养分因子的优化方案,从而为新疆枣园的科学施肥与精准化管理提供参考依据和技术指导.[方法]对新疆8个灰枣主产县市的24个枣园的枣果营养品质和土壤养分含量进行测定,运用R语言和SIMCA多元统计软件分析并筛选出影响枣果品质的重要土壤养分因子,并利用Lingo软件建立线性规划方程,探明枣果品质最优时土壤养分因子的优化方案.[结果]研究区的枣园土壤皆为碱性土壤,土壤中的碱解氮含量匮乏,而速效磷含量丰富且皆处于适宜含量范围内,各枣园间土壤速效钾含量差异
[目的]了解薄壳山核桃不同品种间煤污病危害程度的差异情况,探寻此病害的致病病菌,为薄壳山核桃抗煤污病品种的选择与煤污病的防治提供理论依据.[方法]以\'波尼\'金华\'马罕\'斯图尔特\'绍兴\'威奇塔\'这6个薄壳山核桃主栽品种为调查对象,调查不同品种煤污病的发病率及感病指数.同时,选取具有煤污病典型症状的叶片作为病原菌鉴定材料,采用划线法进行病原菌的分离,通过形态学观察与rDNA-ITS序列分析对煤污病病原菌进行鉴定,并采用柯赫氏法则加以验证.[结果]不同品种的发病率由高到
[目的]明确德宏州油茶炭疽病病原种类及其生物学特性,为油茶炭疽病的综合防控提供一定的参考依据.[方法]以油茶疑似炭疽病的叶片为材料,采用组织分离法分离病原菌,利用形态学结合ITS序列分析所获得菌株的分类地位,再回接油茶离体叶片验证其致病性及进行复合侵染实验,最后对病原菌的生物学特性进行研究.[结果]德宏州油茶炭疽病发生严重,野外调查发病率达84%,病情指数达33.明确了油茶炭疽病的病原菌为果生炭疽菌(Colletotrichum fructicola)和暹罗炭疽菌(C.siamense).分离代表性菌株D
[目的]为分析少刺藤椒优良品系和常规藤椒在挥发油含量、主要挥发性成分及其相对含量方面的差异,以期为已培育出的少刺藤椒品系应用推广提供科学依据.[方法]以少刺藤椒优良品系YTCJ1和YTCJ2为研究对象,以常规藤椒作为CK,采用GC-MS对鲜椒果实挥发性物质进行定性、定量分析.[结果]少刺藤椒YTCJ1和YTCJ2的挥发油含量均为3.20 mL·100g-1,比CK提高14.28%;3个品系藤椒挥发性成分总离子流出峰时间主要集中在前32 min,共鉴定出54种化合物,其中YTCJ1鉴定出49种,YTCJ2鉴