基于掩膜估计的语音增强算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：llpgxyu

【摘要】

：

【作者】

：

江家麒

【出处】

：

电子科技大学

【发表日期】

：

2020年07期

【关键词】

：

语音增强掩膜估计机器学习阵列信号处理

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音信号是人类日常生活不可或缺的信号之一,以语音信号为处理对象的技术与应用层出不穷,语音增强正是最受关注的语音信号处理技术之一,广泛应用于语音编码、语音识别、听力辅助以及军事通信等领域。随着人工智能的发展,机器学习技术也被逐渐应用到语音增强技术中。相较于传统语音增强算法,机器学习算法的融合提升了语音增强算法的性能,却也带来了新的问题,包括机器学习模型的选择、语音信号特征的选择、模型输出结果的应用等。针对上述问题,本文以阵列信号处理为基础,主要研究基于三种不同机器学习模型的语音增强算法,借助语音信号特征的掩膜估计,进行更准确的波束形成,从而提升语音增强算法性能。具体内容如下。1)研究了基于支撑矢量机(Support Vector Machine,SVM)的语音增强算法,提出了采用非归一化加权频率融合的方法。本文对利用语音信号频域掩膜估计进行特定频段归一化加权融合的过程进行了研究,针对该过程提出了采用非归一化加权融合的方法,并对这两种方法进行了理论分析,与传统宽带波达方向角(Direction of Arrival,DOA)估计算法进行了对比仿真,验证了改进的有效性以及这两种方法对阵列误差鲁棒性不足的问题。2)研究了基于复高斯混合模型(Complex Gaussian Mixture Model,CGMM)的语音增强算法。本文对基于CGMM的语音信号时频域掩膜估计以及利用掩膜估计进行导向矢量及协方差矩阵估计的过程进行了研究,并将该算法与基于SVM的语音增强算法以及基于传统宽带DOA估计的语音增强算法进行了对比分析,仿真发现该算法对阵列误具有差较好的鲁棒性。3)研究了基于卷积神经网络(Convolutional Neural Networks,CNN)的语音增强算法,提出了利用时频域二值掩膜估计波束形成相关参数的方法。本文对利用语音存在概率进行导向矢量及协方差矩阵估计的过程进行了研究,针对该过程提出了利用语音存在概率估计时频域二值掩膜并进行参数估计的方法。本文对这两种方法进行了理论分析,并与采用SVM的语音增强算法和采用CGMM的语音增强算法进行了对比仿真,验证了改进的有效性以及这两种方法对阵列误差的鲁棒性。

其他文献

社区居家养老服务政府监管研究

人口老龄化是一个困扰全世界各国家的普遍性问题,对人类历史进程的每一步发展的影响都是至关重要并且深刻持久的。作为人口老龄化程度比较高的国家之一,现在中国老年人口不仅数量是最多,增长速度也是最快的,人口老龄化问题任重而道远。近年来,全国上下认真贯彻落实习近平新时代中国特色社会主义思想,积极构建以居家为基础、社区为依托、机构为补充、医养相结合的养老服务体系,经实践证明,这种社区居家养老服务模式符合我国社

学位

社区居家养老服务政府监管养老机构监管指标体系

流韵的画清新的诗──谈《我的空中楼阁》的意境美

期刊

意境美《我的空中楼阁》人生追求

利用洗矸生产水泥的工艺和效果

阐述了利用洗矸生产立窑水泥的工艺措施及影响因素。

期刊

煤矸石水泥制备工艺熟料

子宫内膜增生的超声分型及诊断价值

目的探讨子宫内膜增生的分型及诊断价值。方法对常规经腹部超声检查并获得病理证实的２８例宫内膜增生进行了回顾性分析与研究。结果超声对宫内膜增生的检出率１００％，对子宫内膜囊

期刊