基于NMF的语音增强算法研究

来源 :辽宁工业大学 | 被引量 : 1次 | 上传用户:liuyingbo1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音增强作为语音数字信号处理的一个重要分支,旨在提高被各种各样噪声干扰的语音质量和可懂度,它主要应用于语音通信、语音识别和语音压缩编码等数字处理系统的前期预处理中。由于传统语音增强算法的局限性和对非平稳背景噪声的处理能力有限,因此近年来相继提出了一些新的算法,其中基于非负矩阵分解的语音增强算法最为突出,借助机器学习从大量的语音数据中解析出所需的数据是当前语音信号处理的研究一个热门方向。论文主要工作是对单通道系统和多通道系统下的语音增强算法进行了研究,提出有监督学习的非负矩阵分解语音增强算法及其算法的改进。首先,对传统语音增强算法及其局限性进行了分析和研究,阐述了非负矩阵分解算法的基本原理及其特点,并对算法收敛性和初始化等问题进行了研究。其次,针对有监督学习算法中存在训练和测试数据特征间不匹配的问题,论文改进了非负矩阵分解算法,在其目标函数中加入确切的正则化约束项,如时间连续性或幅度谱的统计先验以及稀疏性等,促使不同字典的区分和判别力,从而提高收集语音数据的准确性。此外,传统语音增强算法系统都是基于短时傅里叶分析-修正-合成结构,而在大多数情况下认为幅度谱估计在听觉感知方面比相位谱更加的重要,因此忽略了相位谱失真的影响。针对相位失真问题,论文提出了基于相位谱修正的非负矩阵分解语音增强的基补偿算法。从数理统计学的角度出发,对非负矩阵分解算法进行分析和研究的同时,并利用语音存在概率和相位谱修正方法提高增强语音质量。最后,针对传统多通道非负矩阵分解算法容易陷入局部最优和计算复杂度较高等问题,本论文提出了一种新的多通道非负矩阵分解模型。该模型主要是利用观测数据的空间协方差进行建模,结合矩阵迹的性质巧妙地推出目标函数,接着利用有监督学习算法原理对麦克风拾取的混合信号进行分析和研究,从而实现混合信号增强或分离效果。实验结果表明在非平稳背景噪声下,该算法不仅更好的降低或抑制了背景噪声干扰,而且提高了收敛速度,使得该算法更具有实用价值。
其他文献
预焙阳极作为电解铝产业的配套产业,其发展与电解铝技术的进步是分不开的。在预焙阳极炭块生产过程中,要经过煅烧,焙烧,成型和组装等工序。本文主要研究的阶段为焙烧阶段,旨
近年来,智能机器人加快了融入人类日常生活的步伐,已经从单一的工业领域转向各个领域。而在智能机器人的相关研究中,导航技术是研究的核心之一,高精度的导航技术对机器人安全
随着社会、经济的飞速发展,人们对无线通信数据的需求量迅速膨胀,对业务种类的要求也日益多样化,未来无线网络将呈现出以业务为主导、多种无线技术共存的发展态势。传统无线
互联网和移动通信技术的飞速发展,以及移动设备的普及,使得移动应用的数量呈现爆发式增长,并且涌现出大量拥有千万乃至亿级别用户的超级应用。伴随着软硬件的不断成熟,各类功
如今,全球逐步趋于一体化,人类社会的协作也越来越迫切。无论是学问、技术、文化,还是日常生活,亦都迫切需要翻译。自中韩建交以来,两国的交流愈来愈是密切,大量的韩国作品被
随着信息技术的快速发展,各行各业都产生了大量的高维数据,如何挖掘隐藏在高维数据中的宝贵信息是现代机器学习研究的一个热点。然而高维数据存储量巨大,计算代价十分高昂,使
伴随着无线通信技术的迅速发展,人们对宽频带、高速率、大容量通信系统的需求也日益增大。为应对大容量固定宽带无线接入和下一代移动通信系统基站高速数据回传等方面的迫切
目的:观察糖尿病大鼠肾脏间质纤维化改变,探讨耐力和抗阻运动对糖尿病大鼠肾脏间质纤维化的影响及可能机制。方法:健康雄性SD大鼠随机分为对照组和造模组,分别饲以普通和高糖
随着移动互联网行业的发展,用户由主动获取资讯慢慢转向被动去接收,第三方资讯类产品也应运而生,例如网易新闻,今日头条,手机百度等等。各产品为提高自己的品牌感知度,会开发
目的:在体育运动中,过度疲劳是因为运动训练量负荷过大,超出机体的承受能力,致使多器官功能紊乱的病理状态。因此,在过度疲劳状态下要及时调整运动方式和及时休息,从而防止由