基于多任务网络的麦克风阵列语音增强技术研究

来源 :赖志鹏 | 被引量 : 0次 | 上传用户:ya4516623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在语音增强任务中,基于神经网络的语音增强方法能够利用网络的非线性拟合能力,构建带噪语音到干净语音的映射,相比于一些传统阵列增强算法不需要声源位置等先验信息。现有的语音增强网络研究工作通常仅在网络的输出端设置一个或多个目标函数。当语音增强任务越复杂,网络需要完成的功能越多,目标函数的极小值点急剧增多,仅通过最终输出误差的反向传播来优化网络参数难以找到较优的解。本文提出一种基于多任务的麦克风阵列语音增强方法,利用先验知识将复杂的增强任务细分为多个增强任务,从而对网络参数的优化方向和过程进行约束和指导,以减少陷入极小值点的几率,降低训练的难度,提高网络增强的效果。本文工作开展工作如下:(1)针对现有去混响降噪网络中存在的训练困难和多目标选取问题,提出了多任务去混响降噪网络。该多任务网络的增强过程依据语音增强系统的功能细分为去混响、降噪和多声道融合三个任务,并针对每一个任务设计对应子网络和目标损失函数;其中设计的多声道融合子网络包含通道卷积的结构,以更好地融合各声道支路网络的输出,实现二次增强。实验结果表明,提出的多任务去混响降噪网络具有较好的泛化性能,在不同信噪比和混响强度下,该网络的增强效果都优于现有的传统算法和基于网络的方法。(2)针对远程语音通信场景中现有回声消除网络方法在有混响和噪声的环境下存在较多回声残留和网络训练困难的不足,提出一种用于远程通信的多任务降噪系统。该系统包含的网络将增强任务划分为回声消除、去混响、降噪和多声道融合任务,每个任务有对应的子网络;通过采用现有的线性回声消除算法对输入做回声预消除,从而减小回声消除子网络压力;此外,为了降低网络训练开销,将多个声道支路网络的参数共享,提出一种声道网络参数共享的多任务降噪网络。在双讲和单讲条件下的实验结果表明,所提的两种多任务降噪网络在性能上都优于对比算法。
其他文献
随着人口老龄化的不断加剧和国家对老年教育的大力支持,老年大学作为实现老年教育的重要载体,在我国蓬勃发展。然而,由于社会经济的快速发展以及我国老年群体架构、需求不断的变化,现有老年大学难以满足老年人多样化的学习需求。另一方面,当前老年大学的设计与建设在国内仍然缺乏系统的理论指导,导致一些老年大学的建设存在功能与需求不匹配的地方。因此,有必要对老年大学建筑进行系统性研究。基于上述背景,笔者选取南方地区
学位
在生产力快速扩张的背景下,市场有效需求不足,实体领域收益率不断走低,而金融领域普遍具有较高的投资收益率。因此,大量实体企业纷纷试水进入金融领域逐利,非金融企业金融化成为普遍现象。但非金融企业过度追求金融化带来的短期收益,容易导致企业“短视”而忽略企业生产经营业务的可持续发展,进而可能对就业产生不利影响。而就业是民生之本、财富之源,攸关社会稳定。因此,本文结合我国的现实背景,探讨我国非金融企业金融化
学位
语音带宽扩展旨在利用窄带语音和宽带语音之间的数学关系恢复窄带语音缺失的高频成分,这项技术有助于公共交换电话网、电话在线会议、蓝牙等一些窄带传输语音提升带宽,也可以用于老旧音频修复等媒体生产领域,还可以结合语音识别等其他信号处理领域提升性能。现有基于深度学习的语音带宽扩展算法主要分为时域和频域两个研究方向,时域算法基于波形建模,波形包络千差万别,规律十分复杂;频域算法基于频域特征建模,频域特征图能直
学位
近年来,5G通信网络的商用和大规模铺设正在逐步推进,5G通信频带中包含了微波频段和毫米波频段。目前微波频段的大规模阵列天线相关的技术和工艺已经十分成熟,因此微波频段的阵列天线已经进入大规模的部署和应用阶段。然而微波频段中的频带资源有限,无法满足人们日益增长的通信需求,因此需要进一步研究毫米波频段阵列天线,拓宽频带资源。毫米波频段阵列天线的通信存在着基站铺设成本,信号能量损耗和天线安置空间被挤占的难
学位
为解决频谱紧张的问题,研究者们致力于找到扩大通信容量的方式,轨道角动量因有无数个正交的模式数而被认为最具有潜力用于提升通信速率的技术。为产生携带不同轨道角动量模式数的涡旋波,相移超表面因有着易加工、低剖平面、高增益、可控制电磁波极化、相位、幅度、阻抗等优势而在众多天线类型中脱颖而出,成为研究者们产生涡旋波青睐的方式。本文基于相移超表面产生涡旋波为研究点,设计了三款不同功能的超表面,分别实现了涡旋波
学位
目前,第五代移动通信(5G)技术已经成为全球热点,对通信系统的小型化、低功耗、多功能等方面提出了新的挑战。射频前端系统作为通信系统中必不可少的组成部分,其性能的提高对整个系统具有重要意义。在一般的设计中,射频前端系统中的滤波器和天线通常是分立设计后直接级联,这大大增加了射频前端的尺寸和复杂性,带来了额外的插入损耗。尤其在毫米波频段,滤波器Q值太低无法和芯片集成,单独封装也面临与天线、芯片多次互连导
学位
食用油脂的质量安全引起了广泛的关注。尤其是油脂在加工及消费过程中产生的有害物、非法添加物严重威胁人们的身体健康。通常情况下,食用油的理化指标可以通过多种色谱分析来确定。因为色谱分析具有特异性和准确性,但存在很大的局限性,即该过程繁琐、耗时、费力,需要熟练的工作人员,并且会产生环境污染。目前,很少有研究报道出一种快速灵敏的技术来识别潜在的非法食用油。表面增强拉曼散射(SERS)是纳米材料与拉曼光谱技
学位
随着我国经济文化的蓬勃发展,现代化教育水平提高,过去只追求功能规模与数量指标的发展模式已无法完全满足师生们的需求,追求教学与学习生活场所高品质化成为当下教育建筑规划与设计的观念主张。同时城市化发展进程带来的校园集约化与韧性建设需求都推动了校园空间往更加复合化的方向发展。高校教学楼建筑功能越来越趋向于复合多元化,而廊道空间作为建筑中最为常见且必不可少的重要组成部分,其功能同样随着时代发展有了新的变化
学位
阻塞性睡眠呼吸暂停低通气综合征(obstructive sleep apnea hypopnea syndrome,OSAHS)是一种常见的睡眠呼吸障碍,目前医疗界主要基于多导睡眠图(Polysomnography,PSG)进行诊断与分析。打鼾是OSAHS最为显著的临床特征,鼾声分析具有操作简单,非侵入性等特点,近年来被广泛用于辅助诊断OSAHS的研究。本文通过分析睡眠录音信号,分离出鼾声与非鼾声
学位
科里奥利质量流量计(CMF)的测量管在激振器的作用下做简谐振动,使两端的传感器受到科氏力的作用发生偏移,实现对质量流量的直接测量。科氏流量计具有高稳定性、高测量精度以及多功能性的优点,不仅可以实现对质量流量的测量,还可以获得密度和温度等,工业精度可达千分之一。但科氏流量计容易受到噪声干扰,对加工过程要求较高,且密度随速度、流体介质等缓慢变化,使得质量流量的测量精度下降。本文首先对研究课题的背景、意
学位