论文部分内容阅读
语言是人类社会文明发展的产物,在现代社会中语音的作用也不再局限于日常交流,而被应用在许多方面。但是在实际应用的过程中,环境噪声的影响是不可避免的,严重干扰了语音信号的采集与识别,同样也令许多语音处理系统性能骤减,因此,我们需要对噪声污染的语音信号进行语音增强处理。随着深度学习理论的成熟和人工智能的发展,出现了越来越多的基于深度学习的语音增强算法,然而受限于数据集和模型的高要求,运算量也相对较大,因此,对于传统算法的优选和改进研究对现有产品系统提高抗噪性能仍然是很有必要的,具有现实应用价值。在实际应用中,既要考虑算法对于语音时频信息保留的完整度,又要考虑硬件电路中的功耗问题,因此从降噪效果和运算量两方面来对比研究各类算法具有十分重要的意义。由于各类语音增强算法都有其优点和缺点,因此在不同的噪声环境下,力求通过研究找到提高系统性能、降低系统功耗的语音增强方法。本文首先从理论上对多种语音增强算法做分析,包括基本减谱法以及多窗谱减谱法,改进减谱法,自适应滤波法,维纳滤波法,改进的小波包语音增强算法。基本减谱法从语音信号的频域层面分离语音信号和噪声,其组织结构简单且运算量比较小,是容易实现的语音增强算法;多窗谱减谱法是对减谱法的改进,使用多个正交的数据窗取平均来求取谱值,得到的结果误差较小;改进减谱法对基本减谱法的改进则集中于噪声的功率谱估计,引入了端点检测和符合人耳的听觉感知特性的Bark子带划分,使得算法对于噪声的功率谱估计更为准确;自适应滤波法可以根据不同时刻的信号特点自动调节权值和参数,能够适应噪声和信号的随机性,实现最优滤波,其性能远远超过固定参数的滤波器;维纳滤波法基于最优均方误差准则来得到增强的语音信号,通过设计一个线性时不变系统,使得输出信号尽可能逼近所期望的信号;改进的小波包法基于小波包语音增强原理,对于小波去噪阈值的确定进行了改进,结合人耳听觉感知原理,更准确的估计其特征。然后对于语音增强在特征提取中的应用做了相应的研究,以基频提取为例,对从谐波角度进行基频提取的谐波和法进行了原理介绍和算法复现,谐波和法具有很好的基频提取性能。在实验中,对纯净的语音信号加入不同类型,不同强度的噪声,包括平稳噪声和非平稳噪声,在Matlab环境下分别用各类算法进行语音增强,对比分析各类算法的语音增强性能。对语音增强性能的评价方法包括降噪效果和运算量,其中降噪效果包含客观指标和主观指标:客观指标采用信噪比增益、分段信噪比,主观指标是语音增强后人耳测听语音信号的正确率。对于运算量的统计则是选取同样的一段语音,统计代码运行阶段算法进行语音增强处理的时间,探究不同算法在不同的噪声环境下的语音增强性能,运算量的大小。通过实验的对比研究发现:第一,在降噪效果方面,综合各个噪声环境下的情况,自适应滤波法,改进减谱法和改进小波包法表现最好,相比于其它三种算法性能提升较大,基本减谱法和多窗谱减谱法差别不大,维纳滤波器法性能最差;第二,在运算量方面,由于基本减谱法运算量最小,以此为基准对其它五种算法进行量化,多窗谱减谱法的运算时间最长,为基本减谱法的18.65倍,其次是自适应滤波法,为11.43倍,第三是改进小波包法,为9.4倍,接下来是改进减谱法,为8.32倍,最后是维纳滤波法,6.77倍;第三,结合降噪效果和运算量的对比结果,改进减谱法运算量相比自适应滤波法运算量减少了 1/3,而降噪效果却大体相当,总体来看实现了降噪效果和运算量的折中,在保证降噪效果的同时也减少了功耗;最后,将改进减谱法语音增强用于语音特征提取,即对有/无降噪处理的带噪语音信号分别用谐波和法做基频提取,其结果与纯净语音的基频提取结果作对比,以检验语音增强对特征提取的改进,实验结果证明改进减谱法作为基频提取前的预处理,能够很好保留语音特征的准确性。上述研究结果对实际语音信号处理系统的性能改进有参考价值,但仍需结合具体系统的硬件和软件环境作后续试验测试和完善。