论文部分内容阅读
实际中,语音信号不可避免地受到各种噪声的干扰,噪声降低了语音质量和可懂度,还可能导致语音处理系统性能的急剧恶化,甚至使整个系统无法正常工作。为了消除噪声干扰,语音处理系统广泛采用语音增强技术来改善语音质量和可懂度,提高系统性能。因此,研究语音增强技术的研究具有重要的意义。本论文研究了基于径向基函数(Radial Basis Function,简称RBF)网络的语音增强算法,并重点介绍了在频域上基于双RBF网络的语音增强算法。论文给出了语音增强算法的基本原理、实现方法以及增强效果。主要工作包括:1在分析传统时域上神经网络语音增强方法的基础上,提出了一种改进的方法。这种方法能够减轻神经网络的负担并且减少训练时间。在Matlab软件平台实现算法仿真,仿真结果表明该方法能够有效地抑制噪声,大幅度地提升语音信噪比(Signal-Noise Rate,简称SNR)。在加各种噪声条件下,该算法具有增强效果好、适应信噪比范围大、方法简单等优点。2在频域上,利用两个训练好的RBF网络分别处理噪声语音的线性预测系数和共振峰参数,并利用这些参数修正语音的频谱包络,然后重建语音。该方法对语音信号的基音频率、频谱斜率、共振峰等语音特征的影响很小,因而能够较好的保留语音信号的频谱结构,使语音品质不致降低。实验结果证明,语音的听觉质量得到很大的改善。3采用Mel频率倒谱距离失真度(Mel Cepstrum Distance,简称MCD)测试语音增强效果。实验表明该方法比传统信噪比更多地反映了可懂度信息,能更准确地评价语音增强算法的好坏和有效范围,是更合理的语音增强算法的度量。