论文部分内容阅读
语音增强旨在抑制含噪语音中的噪声并保证增强语音的质量。传统语音增强算法如谱减法、维纳滤波法等,不适合处理非平稳噪声,是因为没有考虑信号的先验信息。为解决这一问题,一类基于信号先验信息的语音增强算法应运而生,其中最具代表性的当属基于隐马尔科夫模型(Hidden Markov Model,HMM)的语音增强算法和基于码书的语音增强算法。这类算法线下利用HMM或码书存储语音和噪声的自回归(Auto-regressive,AR)谱形状先验信息,线上结合某些参数估计器估计语音和噪声的AR模型参数,包括AR谱形状和谱增益,并利用获得的AR模型参数构建维纳滤波器增强含噪语音。因为估计的AR谱增益能够快速追踪线上噪声能量,所以可以较好地处理非平稳噪声,但该类算法仍然存在一些问题。例如,传统并行HMM(Parallel HMM,PHMM)语音增强算法忽略了训练集与测试集能量不匹配问题,传统码书驱动语音增强算法AR模型参数估计精度不高、无法抑制谐波噪声和噪声需要分类等问题。为此本文提出了相应解决方法。本文的研究工作主要包含以下三部分内容:第一,基于传统的PHMM语音增强算法原理,本文提出了一种增益自适应的PHMM语音增强算法。该算法将自回归(Auto-Regressive,AR)谱系数和梅尔频率谱(Mel-Frequency Spectral,MFS)系数作为并行特征,用于训练PHMM,所得PHMM由AR-HMM和MFS-HMM构成,其中AR-HMM用于估计维纳滤波器,而MFS-HMM用于获得维纳滤波器的加权值。同时,所提算法引入了两个能量增益因子用于自适应调整线上语音和噪声能量,解决了训练集与测试集之间能量不匹配问题,提高了算法的鲁棒性。第二,基于传统的码书驱动语音增强算法原理,本文提出了一种利用马尔科夫过程和语音存在概率的码书驱动语音增强算法。该算法利用马尔科夫过程对相邻帧间码字的相关性建模并用于优化贝叶斯参数估计器,提高了AR模型参数估计精度。同时,该算法将语音存在概率与码书驱动维纳滤波器相结合,解决了传统码书方法无法抑制含噪语音谐波间噪声的问题,保证了增强语音的感知质量。最后,针对传统码书驱动语音增强算法中AR谱增益估计精度不高以及噪声分类问题,本文提出了一种基于AR谱增益乘法迭代估计的码书驱动语音增强算法。该算法利用线上噪声估计模块获得的噪声AR谱形状取代线下训练噪声谱形状码书,并采用乘法迭代估计方法估计AR谱增益,这不仅解决了噪声分类问题,而且提高了谱增益的估计精度,所获得的增强语音能量保留更高,残余噪声更少。