论文部分内容阅读
语音是人与人之间最直接、最便捷的交流方式,噪声的存在降低了语音信号的清晰度和可懂度,影响了人们的正常交流。在低信噪比环境下,噪声的干扰给语音信号处理带来很大困难。因此,低信噪比环境下,人们需要更优良的语音增强技术对含噪语音进行降噪,以便后续进行高效的语音识别等处理。因此研究低信噪比环境下的语音增强技术具有重要的理论意义和实际价值。本文的研究目标是在低信噪比环境下降低噪声对语音的干扰,提升语音增强的效果。为此,本文首先从语音端点检测出发,提出了一种基于MFCC倒谱距离的自适应语音端点检测方法。接着基于精准的端点检测,针对维纳滤波语音增强算法由于端点检测不准确导致增强效果不佳的问题,对检测环节进行了改进,提升了增强效果。为了解决更复杂噪声下的去噪问题,文章最后研究了基于深度神经网络的语音增强技术。本文所做的工作和创新如下:(1)通过对语音增强技术发展进程的调研,我们了解了语音增强技术的发展近况及其相关的语音处理技术。重点对语音端点检测技术做了一定的研究和调研工作,介绍了多种常用的语音端点检测方法并将他们逐个实现以便用于后期的比较。另外,详述了谱减法、维纳滤波法和神经网络语音增强法的模型框架和实现过程。(2)针对传统语音端点检测算法在恶劣噪声环境下难以保证检测精度的问题,本文提出了一种基于MFCC倒谱距离的结合多窗谱估计的自适应端点检测方法。在语音检测阶段,首先计算各帧与无话帧之间的MFCC倒谱距离,以此为特征,选取合适的阈值来进行判决。该阈值与前导无话帧的MFCC系数和噪声的平均MFCC系数之间的差值密切相关,该算法可以在不同的噪声环境中自适应的调整阈值,从而提高了语音端点检测精度。实验数据表明,该端点检测方法和其他常用检测算法相比,在低信噪比环境下仍具有较高的端点检测率,对噪声具有强的鲁棒性。(3)针对传统维纳滤波语音增强算法由于端点检测不够精准导致噪声估计不精确从而最终影响语音增强质量的问题,本文采用基于MFCC倒谱距离的自适应端点检测方法来对维纳滤波增强算法的噪声段进行准确估计。实验表明,改进后的算法能够提高增强语音的质量。(4)针对上述方法在非平稳噪声低信噪比下效果欠佳的问题,我们搭建了神经网络语音增强系统,取得了不错的语音增强效果。接下来利用维纳滤波语音增强算法对训练及测试语音进行预增强后再送入神经网络进行训练和测试,即将两种语音增强方法结合,进一步提升了复杂噪声环境低信噪比下的语音增强效果。