论文部分内容阅读
在语音信号处理系统中,感兴趣的语音通常会被背景噪声干扰,严重损害了语音的质量和可懂度,作为前端处理模块,语音增强算法成为众多学者的研究焦点,多种语音增强算法已被提出用于噪声抑制,主要包括基于信号处理的方法、基于统计模型的方法和基于模型训练的方法等。在这些方法中,基于信号处理的方法,谱减法和维纳滤波法是两种最具有代表性的算法,当正确估计背景噪声时,该类方法能取得较好的语音增强性能,然而,在现实环境中,尤其是在低信噪比的条件下,由于噪声的随机性和突变性,使得噪声很难被准确估计,导致增强性能大大下降,同时易引入“音乐噪声”;基于统计模型的方法,虽然在低信噪比的条件下也可以取得比较好的增强性能,但是考虑到噪声与语音间的相互关系非常复杂,需要一些信号间的独立性假设以及对特征分布的高斯性假设,然而这些假设通常是理想的,在未知的不匹配噪声条件下,其性能恶化;基于模型训练的语音增强方法在低信噪比、复杂背景噪声条件下表现出了更好的效果。基于深层神经网络的语音增强就是近年来兴起的一种基于模型训练的方法,深层神经网络依靠对复杂特征优秀的抽象和建模能力,在语音信号处理领域引起了广泛的研究,基于深层神经网络的语音增强方法几乎无任何前提假设,可以很好地学习到从带噪语音特征到纯净语音的复杂非线性映射函数。本文基于深层神经网络在语音增强中的应用,分别从两个不同的角度,即声学特征和训练目标,提出了三种改进的基于深层神经网络的语音增强算法,借以解决基于深层神经网络语音增强中特征提取和目标函数优化等问题,提高增强语音性能。本文先是在TIMIT语料库和Noisex-92噪声库上仿真,对所提出的算法进行性能测试,然后利用语音监听设备采集现实环境中的带噪语音,对提出的三种算法进行实测,与传统的语音增强算法以及现有常用的基于深度学习的语音增强算法相比,本文提出的算法在增强语音可懂度、感知效果和语音质量等方面都取得了较好的效果。