论文部分内容阅读
现实生活中,由于说话人经常要处于各种嘈杂的环境中,语音不可避免的会受到周围环境噪声的影响,这不仅使得接受者对这些语音难以感知和理解,还会使得处于这些环境下的语音处理系统的性能大打折扣。为了减小背景噪声对语音的影响,需要进行语音增强来抑制背景噪声、提高语音质量。语音增强是语音信号处理的重要内容,一方面,通过进行语音增强,可以提高噪声环境下语音的清晰度、可懂度和舒适度,改善人的听觉感知质量;另一方面,语音增强也是语音处理系统中必不可少的环节,在进行各种语音信号处理操作前首先要进行语音增强,以减小噪声对语音处理系统的影响,提高系统的工作性能。对于语音增强的研究源于人们现实生活中的技术需求,有着重要的实际应用价值。本文研究工作围绕基于噪声估计的单通道语音增强方法展开,针对现有噪声估计算法的不足,从时频相关性和噪声分类两个角度提出了一些新的噪声估计和语音增强方法,并从理论和实验两方面分析和验证了所提算法的有效性和普遍适用性。本文的主要创新工作体现在以下几个方面:1)提出了一种基于时频相关性的噪声估计算法。含噪语音的时频相关性是判断含噪语音中是否有语音存在的重要特征,本文通过计算各时频单元间的相关函数值,得到对某帧是否有语音存在的一个粗判决。利用该判决值,对传统最小控制递归平均(IMCRA)算法中的关键步骤进行改进,得到一种新的噪声估计算法。实验结果表明,提出的算法较传统IMCRA算法对噪声的估计更加准确,能够明显减小噪声水平上升时的噪声估计延时。2)提出了一种基于Bark域能量分布的噪声分类方法。实际环境中,噪声的种类繁多,对语音的影响也不尽相同,对于噪声的分类处理可以提高噪声估计和语音增强的性能。本文通过对噪声的Bark域能量分布特性进行分析,得到一个18维的特征向量,并采用支持向量机(SVM)进行分类,提出了一种高准确率的噪声分类方法。3)提出了一种基于噪声分类的语音增强算法。首先,通过对训练数据集的含噪语音进行语音增强,得到不同噪声类型下IMCRA算法的最优参数组合。其次,在前文提出的噪声分类算法的基础上,提出了一种对于含噪语音噪声类型的判断方法,在得到含噪语音的噪声类型后,选取相应的最优参数IMCRA算法进行噪声估计。最后,采用最优修正对数谱幅度语音估计计算增强后的语音。不同噪声条件下的语音增强实验表明,本文算法相对于传统IMCRA算法能够更好的保留语音信号和抑制背景噪声,提高了增强后语音的综合质量。4)提出了一种用于噪声估计的改进最小值搜索方法。含噪语音短时功率谱的最小值搜索是噪声估计的基础。为了提高对非平稳噪声估计的准确性,减小噪声水平上升时的噪声估计延时,提出了一种同时使用大小两个搜索窗进行并行搜索的方法,最小值搜索的最终结果由两个搜索的结果和基于噪声分类的语音存在二值判决共同决定。实验结果表明,对于高度非平稳的噪声,这种最小值搜索方法能够有效的减小噪声估计的延时问题,显著提高增强后语音的质量。