论文部分内容阅读
日常生活中,在一些比较密闭的室内空间里,当使用电话机、助听器、手机等设备时,声源距离声音接收器的位置较远时会产生强烈的混响现象,混响的存在导致语音的各音节间出现掩蔽效应,严重影响了听觉效果。语音信号的去混响处理作为语音增强的一个重要组成部分,同时为语音合成、声源定位、语音识别等语音信号处理提供前期预处理。此外,语音信号去混响相关技术还可广泛的应用于建筑声学、振动声学、地震数据分析、生物医学、雷达声呐等其它方面。下面就是本文研究工作的主要内容:首先,分析了混响的产生、数学模型和特征参数等理论,并研究了语音去混响性能的评测指标,包括两种主观评测指标和三种客观评测指标。同时大量的仿真实验证明:两种频域客观评测方法比时域客观评测方法更适用于反映主观感受。其次,分析了复倒谱的相关理论,并在单通道的混响条件下,分别研究了复倒谱域滤波的语音去混响方法、基于最小相位分解的语音去混响方法和复倒谱盲解卷积的语音去混响方法,并对这三种方法进行了仿真分析。最后,针对单麦克风语音去混响技术仅利用时域和频域信息,而可利用的空间信息有限,很难取得较好的去混响效果,本文研究了麦克风阵列的语音去混响技术,并将波束形成技术与其它单通道语音去混响技术相结合。首先研究了基于固定波束形成的DSB语音去混响方法和基于自适应波束形成的TF-GSC语音去混响方法,并对DSB和TF-GSC方法进行仿真分析,针对它们对加性噪声和波束方向上混响的良好抑制效果,将DSB与复倒谱盲解卷积技术相结合,得到更有效的去混响方法。将TF-GSC与最小相位分解技术相结合,并针对基于TF-GSC和最小相位分解的语音去混响方法计算量较大的问题,分析了改进的基于TF-GSC和最小相位分解的语音去混响方法,该方法利用一路麦克风采集的混响语音的相位来替代全通分量的相位信息以减少运算量。并通过对仿真结果的比较,波束形成技术与其他单通道语音去混响方法相结合的方法获得了很好的去混响效果。