论文部分内容阅读
房间混响是在封闭空间内进行语音通信时,语音信号从声源到达传声器的多径反射所造成的,其中到达传声器较晚的反射波称作晚期混响,晚期混响会对语音造成自掩蔽和重叠掩蔽效应,因而影响语音的可懂度。为了消除晚期混响给语音带来的影响,语音去混响技术应运而生,并在近年来得到了广泛研究与应用。然而目前存在的去混响方法都不能十分精确地估计混响,导致处理后的语音通常会带有一定程度的谱失真,造成语音不连续、语音起始端丢失、“音乐噪声”残留等问题。针对这些问题,本文展开了深入的研究,寻求解决这些问题的有效方法。本文的主要研究内容和创新点包括以下三个方面: 1)提出了一种奖惩因子修正的统计模型法,将基于房间冲激响应模型的晚期混响谱方差估计用奖惩因子进行合理的约束,有效地保留了处理语音的大多数语音起始位置,消除了处理语音音节的不连续。 2)提出了一种新的基于线性预测分析的预白化技术,修正了长时多级线性预测去混响算法,有效提升了处理语音中隐藏的第一、二共振峰,从而恢复了语音的低频信息。 3)提出了一种基于人耳听觉特性的去混响算法,有效地解决了噪声环境下的处理语音中“音乐噪声”残留的问题,提高了处理语音的听觉舒适度。