论文部分内容阅读
随着科技的发展,我们置身于现代化智能设备、高科技环境之中,外界噪音干扰使得麦克风无法接收到纯净的语音,一般都带有噪音,使得语音能被理解程度和整体语音处理系统的功能都受到影响。所以,对带有干扰的语音进行增强处理显得尤为重要。麦克风阵列可以最大化的利用语音信号的空时信息,滤除噪音的效果比单麦克更为显著。此外,随着电子设备的发展日益趋于小型化,作为语音采集设备的麦克风阵列,其体积不能太大,阵元不能太多。本文根据以上的介绍,重点研究二元麦克风阵列的语音增强算法,内容涵盖以下几点:(1)介绍了麦克风阵列的远场、近场模型,和它的拓扑结构,说明了对语音信号的预处理方式和基本噪声的特性,以及在主观、客观两种方式下评估语音质量和可理解程度的方法。(2)给出了改进的噪声互功率谱估计算法。以往的噪声估计算法中,MT算法反应和更新噪声功率谱估计速度慢,IMT算法噪声过估计,VAD算法无法应用于不稳定的噪声环境中。改进的算法运用递归平均技术,优点是能让平滑因子依据每个频点的实际信噪比而做出相应的更改;经过仿真证明:相较于IMT算法,改进的噪声互功率谱估计算法性能更好,也没有增加算法的难度。(3)给出了一种基于基频和信噪比信息的谐波相位估计方法。二元麦克风阵列语音增强算法只是修改了带有噪声的语音的幅度谱,并没有处理带有噪声的语音的相位。考虑到带噪语音与纯净语音之间存在相位差,将带噪语音的瞬时相位分解为线性相位和展开相位,并对展开相位进行时频平滑滤波。平滑处理后的展开相位和线性相位组合成增强的相位,这能使语音重构。经过仿真证明,给出的方法整体提升了系统的去躁效果。(4)给出了一种使相位与幅度谱估计结合的麦克风阵列语音增强算法。它应用了改进噪声互功率谱估计算法的幅值增强技术,联合谐波相位估计算法的相位增强技术,可以同时提取带噪语音和噪声的幅度估计和相位估计,并实时的修正噪声功率谱和相位谱。与改进噪声互功率谱估计算法和谐波相位估计算法相比,该方法可以获得更高的语音质量。