强混响下的语音信号分离方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:coolyangbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号是人类社会信息交流的一个重要的载体,随着人工智能技术的发展,人机交互的应用场景越来越多,使机器能够具备与人类一样接收和理解语音的能力,是人工智能领域非常重要的问题。然而,现实声学环境通常存在未知噪声和多径效应,在获取的语音信号中包含复杂的噪声特性,增加了机器对语音的识别与理解的难度。因此,降低语音噪声和分离纯净语音成为一个热门的研究课题。论文分析了复杂环境下的声学混合模型,研究了强混响(高阶卷积混合)情况下的去混响与噪声抑制方法,实现语音信号的分离与增强。论文的主要研究内容和创新性贡献如下:1.提出了一种快速去排序混乱方法。利用混合矩阵在相邻频点之间的慢变化特性,通过最小化相邻频点矩阵梯度求解出置换矩阵。采用检测异常分离矩阵的方法,消除了异常分离矩阵对去排序混乱的影响。论文方法仅根据分离矩阵就能够求解出置换矩阵,显著降低了计算复杂度。仿真结果验证了论文方法的有效性。2.提出了一种基于联合对角化的高阶卷积混合盲分离方法。对高阶卷积混合的语音信号,采用两次短时傅里叶变换(STFT)将高阶卷积混合模型转化为瞬时混合模型,通过联合对角化方法初步估计出分离矩阵,并在频域和变换域上分别采用去排序混乱方法,实现高阶卷积混合语音信号的盲分离。对仿真数据高阶卷积混合信号进行盲分离实验,结果表明论文方法比现有方法具有更好的分离性能。3.提出了一种基于GAN的单通道卷积混合语音分离方法(CDGAN)。采用改进的CycleG AN网络来抑制由多径效应引起的混响,并通过差分GAN网络实现语音分离,采用了输入时频谱样本的实部和虚部,使GAN网络具有恢复信号相位信息的能力。仿真实验结果表明,本文CDGAN方法比现有方法能够更好的分离出目标语音信号,尤其是在高阶卷积混合情况下,CDGAN方法分离出的语音信号残留噪声更小。4.提出了一种自监督学习的语音增强方法(SS-SENET)。利用P网络重构出噪声的主成分,并采用D网络抑制掉噪声的随机成分,并在实际应用过程中,在线提取出背景噪声,构成P网络的在线训练样本,在增强语音信号的同时,对P网络的权值参数进行微调,使SS-SENET方法更好的适应当前声学环境,进一步提高噪声的抑制能力。通过对仿真数据和实测数据实验,与现有监督学习方法比较,论文的SS-SENET方法的语音信号增强效果更好。
其他文献
<正> 磷作为水中藻类的营养剂,具有促进藻类迅速生长和污染水质的作用。并且高pH值的废水还会使水中生物死亡,作用极坏。基于上述情况,各企业单位都必须对其进行处理,以防水质污染。为此,日本内外化学制品公司现在出售有
期刊
现实世界中的生物、社会以及互联网等大规模系统都可以表示成由节点和边构成的复杂网络,复杂网络理论及方法有助于人们认识系统的内在运行机制、掌握成员的分布动态以及预测潜在的演化趋势。随着互联网技术革命的到来,节点间的连接关系和属性信息等真实网络数据开始以更加多源的形态被展现,属性网络也应运而生。属性网络进一步整合了节点的属性信息,将拓扑结构和属性特征结合,从而能更好地建模实际场景,显著提升语义挖掘性能,
学位
弹道目标识别是弹道导弹防御系统的关键技术,而雷达作为弹道导弹防御系统中的核心设备,在弹道目标识别中发挥着不可替代的作用。面对诱饵与弹头的外形和电磁特性等方面一致性越来越高的情况,基于三维姿态特征的识别方法成为弹道目标识别领域的一个研究热点。弹道目标的三维姿态反映了不同类型目标在中段飞行中的受控程度,其三维姿态参数中包含了目标的微动信息,可以作为弹道目标识别和拦截的依据。因此,弹道目标的三维姿态参数
学位
财务共享服务中心的建设需要将信息技术作为基础的载体,对企业产生的各项财务数据进行处理和分析,从而帮助企业控制运营成本,让企业的每个环节都有开展的依据,并为企业财务管理目标的实现做好相对应的准备。对此,本文探讨了财务共享服务中心背景下加强企业财务管理的有效方式,希望可以帮助企业实现财务管理的目标。
期刊
高分辨图像在国防安全、公共安全以及医学成像方面具有重要应用。由于低性能成像器件以及非理想成像条件,实际获得的图像常存在噪声、模糊以及较低的分辨率,严重降低了人们对图像的判读以及图像分析识别算法的性能。由于噪声和模糊核未知且难以准确估计,图像恢复是一个严重的病态逆问题。一般来说,现有图像恢复方法可分为两类,即基于模型的图像恢复方法与基于学习的图像恢复方法。前者通过构建图像的先验模型,并将图像恢复问题
学位
癌症,泛指恶性肿瘤,是一种复杂、异质且严重危害人类健康的复杂疾病。研究人员对癌症的研究已经持续了数十年。随着高通量测序技术的不断发展及其成本的不断下降,目前已经产生了大量不同组学的数据。人们普遍认为,不同层面的生物数据共同影响和调控多个生物学过程,为科研人员研究癌症的形成和发展提供更可靠的信息。因此,多组学数据集成作为一种综合利用不同组学数据研究癌症相关问题的计算方法,近年来受到生物信息学领域的广
学位
飞行器以高超声速在高空大气层中飞行时,所产生的包覆飞行器的等离子鞘套,会干扰和屏蔽雷达回波信号,导致信号幅度和相位发生畸变、多普勒谱异常展宽,增加了雷达探测的难度。本文针对这一问题,分析了等离子鞘套中的全反射临界角、阻尼效应及共振面屏蔽效应,改进了等效传输线电磁波反射计算方法,提出了稳态流动等离子鞘套环境下的雷达回波信号计算方法,建立了稳态流动等离子鞘套包覆目标的雷达距离像模型,仿真分析了稳态流动
学位
自从2004年石墨烯被成功制备之后,二维材料因其独特的几何结构以及其与块体材料大不相同的电子结构和光电特性受到了研究者们的广泛关注。二维材料拥有近乎无限的体表面积比以及足够多的反应发生的位置,使得它在光电催化、光电磁传感领域有着三维材料没有的特点。二维材料中的过渡金属二硫化物(TMDs)族材料有禁带宽度分布广泛的特点,其中PtSe2由于其对层数十分敏感的光电性质以及可以利用应变和缺陷等方式有效调节
学位
在当今财务共享服务理念下,企业实施财务管理应当对现有的工作管理模式、管控内容进行定向化调整,同时在财务共享管理框架下企业也需要对现有的管理结构、管理系统进行重新构建、打造,实现企业内部各项信息资源的有效流通,为企业预算管理、成本核算管理,以及管理会计工作的开展提供稳定高效的数据支撑,帮助企业实现财会管理以及业财一体化管理。本文在财务共享服务框架下,对企业财务管理的策略进行分析、探讨。
期刊
提升雷达对于高速机动目标的探测能力对于现代化国防建设来说具有重大的现实意义。雷达目标检测的核心在于目标回波能量的相参积累,然而,高速机动目标在相参积累的过程中容易发生距离徙动现象和多普勒频率徙动现象,这两个现象会使目标回波能量沿着距离维和多普勒频率维发生散焦,从而会给高速机动目标的相参积累带来严重的性能损失,进而引发雷达检测性能的显著退化。尽管针对该问题已经有了不少的研究成果,但是如何实现低运算量
学位