基于掩膜估计的语音增强算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:llpgxyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音信号是人类日常生活不可或缺的信号之一,以语音信号为处理对象的技术与应用层出不穷,语音增强正是最受关注的语音信号处理技术之一,广泛应用于语音编码、语音识别、听力辅助以及军事通信等领域。随着人工智能的发展,机器学习技术也被逐渐应用到语音增强技术中。相较于传统语音增强算法,机器学习算法的融合提升了语音增强算法的性能,却也带来了新的问题,包括机器学习模型的选择、语音信号特征的选择、模型输出结果的应用等。针对上述问题,本文以阵列信号处理为基础,主要研究基于三种不同机器学习模型的语音增强算法,借助语音信号特征的掩膜估计,进行更准确的波束形成,从而提升语音增强算法性能。具体内容如下。1)研究了基于支撑矢量机(Support Vector Machine,SVM)的语音增强算法,提出了采用非归一化加权频率融合的方法。本文对利用语音信号频域掩膜估计进行特定频段归一化加权融合的过程进行了研究,针对该过程提出了采用非归一化加权融合的方法,并对这两种方法进行了理论分析,与传统宽带波达方向角(Direction of Arrival,DOA)估计算法进行了对比仿真,验证了改进的有效性以及这两种方法对阵列误差鲁棒性不足的问题。2)研究了基于复高斯混合模型(Complex Gaussian Mixture Model,CGMM)的语音增强算法。本文对基于CGMM的语音信号时频域掩膜估计以及利用掩膜估计进行导向矢量及协方差矩阵估计的过程进行了研究,并将该算法与基于SVM的语音增强算法以及基于传统宽带DOA估计的语音增强算法进行了对比分析,仿真发现该算法对阵列误具有差较好的鲁棒性。3)研究了基于卷积神经网络(Convolutional Neural Networks,CNN)的语音增强算法,提出了利用时频域二值掩膜估计波束形成相关参数的方法。本文对利用语音存在概率进行导向矢量及协方差矩阵估计的过程进行了研究,针对该过程提出了利用语音存在概率估计时频域二值掩膜并进行参数估计的方法。本文对这两种方法进行了理论分析,并与采用SVM的语音增强算法和采用CGMM的语音增强算法进行了对比仿真,验证了改进的有效性以及这两种方法对阵列误差的鲁棒性。
其他文献
人口老龄化是一个困扰全世界各国家的普遍性问题,对人类历史进程的每一步发展的影响都是至关重要并且深刻持久的。作为人口老龄化程度比较高的国家之一,现在中国老年人口不仅数量是最多,增长速度也是最快的,人口老龄化问题任重而道远。近年来,全国上下认真贯彻落实习近平新时代中国特色社会主义思想,积极构建以居家为基础、社区为依托、机构为补充、医养相结合的养老服务体系,经实践证明,这种社区居家养老服务模式符合我国社
阐述了利用洗矸生产立窑水泥的工艺措施及影响因素。
目的 探讨子宫内膜增生的分型及诊断价值。方法 对常规经腹部超声检查并获得病理证实的28例宫内膜增生进行了回顾性分析与研究。结果 超声对宫内膜增生的检出率100%,对子宫内膜囊
<正>"校本课程"是指以学校为课程主体,自主开发与实施的一种课程,同时也是与国家课程、地方课程整合的一种课程。在本文中,经典阅读校本课程的核心取向是与国家课程、地方课
浅谈地方煤炭简易装车系统刘文欣平顶山选煤设计院(河南467002)1前言地方煤矿作为我国煤炭工业的重要组成部分,其产量已占到全国煤炭总产量的一半以上。地方煤矿的蓬勃发展极大地缓解了
为了确保煤矿安全运输,研究了无极绳绞车运输系统及其综合保护装置,根据工作面通风系统及巷道布置情况,对无极绳绞车进行了选型,研究了无极绳绞车运输系统的组成和主要功能,
当前,我国经济正处于增长速度放缓、结构亟待调整的阶段。中小企业作为我国市场经济的重要组成部分,在技术、制度创新方面,有着大型国有企业不可比拟的天然优势。因此,鼓励、
针对淮南地方煤矿矿井多在选煤厂煤泥水由点散较量低,粘质变化较大的特点,提出取于各煤矿,各煤种的不同条件,应采用不同的分选工艺,力求作到简单,高效,投资省,见效快,使淮地方煤矿能尽