论文部分内容阅读
在实际环境中,噪声总是无处不在,语音信号难免要受到各种干扰噪声的影响。这些噪声的存在不仅会对人与人之间的沟通造成影响,还会降低智能音箱、数字助听器等依赖语音输入的电子产品的性能。因此,对带噪语音信号进行增强处理不仅很有必要,而且具有广泛的应用前景。本文根据实际项目的要求,以四个麦克风组成的麦克风线阵为研究对象,研究了传统的麦克风阵列语音增强算法,并在其基础上进行改进。搭建了一个能在真实环境中使用的语音降噪样机系统,并将改进算法成功移植到该系统上,且通过测试。论文主要研究内容及研究成果如下:首先,讲述了课题的研究背景与意义,相比传统的单麦克风的语音增强方法,介绍了利用麦克风阵列进行语音增强所具有的优势。简述了麦克风阵列的应用场景以及国内外关于麦克风阵列的研究现状。其次,主要介绍了语音信号处理的一些基本知识,包括预滤波、加窗、分帧等,接着介绍了麦克风阵列处理语音信号的模型已经噪声和混响的特性,最后详细介绍了几种语音增强方法的性能指标。然后,阐述了LCMV自适应波束形成和GSC两种传统麦克风阵列语音增强方法的基本原理。针对GSC方法需要精确的时延估计这一不足,介绍了利用传输函数比率的TF-GSC方法。虽然TF-GSC方法不需要精确的时延估计,但利用传输函数比率的方法来估计固定波束形成器时,会造成较大的误差,且基于GSC结构的TF-GSC方法对非相干噪声的抑制能力较弱。因此,本文从以下两个方面进行优化。第一,在估计固定波束形成器时引入了一个比例因子K对其进行优化。仿真结果表明改进后的方法的输出分段信噪比高于之前的方法。第二,利用一种基于心理声学的后置滤波方法对其进行优化。最后仿真结果表明该后置滤波方法能够有效地消除残留噪声,进一步提高了输出分段信噪比。最后,编写了利用TCP/IP协议进行数据传输的文件传输程序,并基于此设计了利用计算机采集数据和DSP开发板完成信号处理的语音增强实验平台,并将算法移植到开发板上。测试结果表明本文改进方法在实验平台上也实现了语音增强的功能,提高输出分段信噪比。