论文部分内容阅读
传统语音活动检测算法在动态(非平稳)低信噪比背景噪声环境下的效果很不理想,这主要是因为传统方法中提取的能量与过零率等检测特征针对的是平稳噪声,对信噪比的变化很敏感。而本文提出的基于语音增强的语音活动检测算法的研究可以很好的解决这个问题,因为本文提出的方法中语音检测算法是基于语音信号周期分解,而语音信号中浊音段的周期性是区别一般噪声信号的重要特征,并且该特征受背景噪声类型和信噪比变化的影响小。在基于语音周期分解的语音活动检测方法中,基频提取的准确性对最终检测性能有很大影响,针对此情况,本文提出了自相关、循环均值幅度差分和YIN三种基频提取算法相融合的方法。在低信噪比的背景噪声环境下基频提取的结果将会受到很大的影响,针对这个问题本文提出方法中的语音增强可以解决这个问题。
本文所做的工作有以下3点:
(1)对语音增强中噪声估计最常用的方法,最小值搜索,改进控制递归均值算法,以及语音增强中增益估计最常用的方法,谱减,卡尔曼滤波,最小均方误差进行了详细的介绍,并对基于最小值搜索和谱减语音增强算法,改进卡尔曼滤波语音增强算法方法以及基于改进最小控制递归算法和最小均方误差语音增强算法这三种方法进行了对比实验,实验结果表明基于改进最小控制递归算法和最小均方误差语音增强算法,也即是本文使用的方法,是这三种方法中最好的,并将该方法用到基频提取算法中,实验结果表明,语音增强之后噪声语音信号基频提取的正确率比语音增强之前有所提高。
(2)对语音信号周期分解的方法进行介绍,并将分解后的周期/非周期部分作为语音活动检测的特征提取,通过似然比计算,进行最终的语音活动检测判决,实验结果表明本文介绍的语音活动检测算法最终的正确率比传统方法有很大的提高。
(3)基频提取在语音活动检测中起的作用比较大,而在低信噪比的环境下基频提取的结果不理想,针对这种问题,本文提出了自相关函数法,循环均值幅度差分函数和YIN三种方法融合的方法进行基频提取。实验结果表明,三种方法融合提取基频的方法比任一种方法的结果都要好,并且最终的语音活动检测的正确率也是最好的。