论文部分内容阅读
随着科技发展,语音信号已经成为人机交互的重要媒介。麦克风阵列相对于传统的单通道麦克风系统,具有空间指向性及高信号增益特性,可以更有效地拾取目标语音信息,被广泛应用于智能家居、可穿戴设备等语音处理系统中。在室内环境中,麦克风阵列工作性能会因房间混响以及各种噪声的干扰而下降,影响人机交互的体验。针对上述问题,本文提出了一种新的麦克风阵列语音增强方法:使用小波变换对传统广义旁瓣抵消器(GSC)结构语音增强算法进行优化,使用卷积神经网络语音增强算法作为后置语音增强算法。提出的改进算法将在FPGA实现硬件加速并验证功能。本文的主要工作有:(1)室内环境中,GSC结构中的阻塞矩阵无法完全阻塞目标语音信号,从而造成语音泄露,影响语音增强的效果。针对此问题,本文提出了一种基于小波变换的GSC语音增强方法:使用小波变换替代阻塞矩阵,通过对麦克风阵列中各通道信号进行小波分解与重构提取各通道的噪声信号,减少语音泄露。(2)GSC结构的语音增强算法能够有效地抑制空间中的相干噪声,但会残留较多的非相干和弱相干噪声。针对此问题,本文采用卷积神经网络语音增强算法作为后置语音增强算法,提高算法对不同种类噪声的抑制能力。(3)对所提出的麦克风阵列语音增强算法进行实验仿真,并与部分现有文献中的算法在不同噪声环境中进行性能对比。实验表明,在-10d B-10d B信噪比范围内,在高斯白噪声与人声干扰下,所提出算法的语音感知质量评价(PESQ)平均得分提高了24.48%;在Babble噪声与人声干扰下,所提出算法的PESQ平均得分提高了17.44%;在pink噪声与人声干扰下,所提出的算法PESQ平均得分提高了21.09%;在实地获取的室内环境噪声中,所提出的算法PESQ平均得分提高了18.74%。(4)所提出的算法硬件验证结果表明,FPGA的输出结果与软件算法的输出结果基本一致,最大误差为2-11,PESQ得分下降了2.65%,在误差范围内证明了硬件实现功能的正确性。