论文部分内容阅读
当今社会,语音交流不仅仅局限在人与人之间,人与机器之间的沟通交流也越来越普遍,特别是现在社会关注度极高的人工智能和数字通信领域,都需要机器对语音信号进行分析、识别或辨识等相应处理。然而在语音信号处理的过程中常常伴随着周围环境噪声的干扰,这些干扰使得语音的质量和可懂度变差,严重影响了语音信号的处理质量。为了提高受污染语音信号的质量和可懂度,需在对其进行分析、识别或辨识等处理之前增加一个语音增强环节,以尽可能地消除背景噪声,最大程度地恢复原始的纯净语音信号。近年来,随着人机交互技术的不断发展,语音增强问题一直都得到了国内外学者的重点关注。围绕语音增强领域中核心参数的估计问题,本文的研究工作主要包括:首先,本文引出并阐述了几种常见语音增强算法的基本原理及其性能评估测度,重点说明了先验信噪比参数在语音增强算法体系的重要地位,同时给出了几种常用的先验信噪比估计算法,对其设计原理及优缺点进行了分析。其次,分析了两步噪声消除先验信噪比估计算法过分依赖增益因子选取的问题,利用语音及噪声信号的高斯分布模型,提出了一种基于幅度平方谱估计的两步噪声消除算法。该算法采用直接判决方法的估计结果来直接获取当前帧的先验信噪比估计,从而有效避免了算法对于增益因子的依赖性。多种噪声环境下的仿真实验表明,论文提出的基于幅度平方谱的先验信噪比估计算法具有更为出色的估计效果。然后,详尽分析了直接判决算法对于当前帧先验信噪比的估计过程,揭示了其暗含的对于语音及噪声相位信息的不合理假设,并分析了该假设条件对于算法估计效果的影响;通过分析噪声、纯净语音和带噪语音信号之间幅度谱与相位的几何关系,将相位信息融合至当前帧先验信噪比的估计过程中,提出了一种新型的直接判决先验信噪比估计算法;文中给出了提出算法的估计步骤及运算流图,并在多种噪声背景及输入信噪比条件下验证了提出算法的优良性能。最后,对全文进行了总结,并对先验信噪比估计问题的未来发展方向进行了展望。