论文部分内容阅读
声学回声消除(Acoustic Echo Cancellation,AEC)技术被广泛应用到免提通信中,它使得通话双方在无需手持终端设备舒适进行通话的过程中免除回声带来的干扰。由于AEC技术应用的场景趋于多样化和复杂化,传统的单通道线性AEC已经不能满足市场需求。立体声声学回声消除(Stereophonic Acoustic Echo Cancellation,SAEC)和非线性声学回声消除(Nonlinear Acoustic Echo Cancellation,NLAEC)这两类进阶AEC技术应运而生。本文分别从自适应滤波算法的鲁棒性、计算复杂度和稳态收敛性着手,对应用于SAEC的两路自适应滤波算法和应用于NLAEC的核函数自适应滤波算法进行深入研究,主要工作的内容如下:首先,针对SAEC场景中经常出现的双端讲话和回声路径突变情况,本文提出了一种双通道的双路径频域算法。区别于传统的ELMS算法中对每条回声路径利用一个滤波器跟踪的方法,本文采用双滤波器结构,通过一个持续更新的背景滤波器和一个非自主更新的前景滤波器同时跟踪一条回声路径,以提高算法在高干扰情况下的鲁棒性。该算法通过背景滤波器持续跟踪回声路径,并由转移逻辑控制其在高干扰环境下将抽头系数传递给前景滤波器来输出稳态误差。这不仅解决了双端讲话时自适应滤波器容易发散的问题,同时还克服了回声路径突变时传统双讲检测(Double Talk Detection,DTD)误判所造成的滤波器系数停止更新问题。在此基础上,本文将双路径频域算法移植到WebRTC平台的AEC模块中,实现并验证了算法的工程应用。其次,本文为实现核函数自适应滤波算法在计算复杂度和收敛速度上的优化配置,提出了一种用于NLAEC的改进型核函数自适应滤波切换算法。该算法首先利用基于快慢包络检测的语音活动检测(Voice Activity Detection,VAD)技术判别语音段的不同能量,然后采用快包络和慢包络差值运算求出能量阈值,进而通过语音信号能量的不同对核自适应滤波算法进行切换。核函数自适应滤波切换算法不仅能够具有传统线性自适应滤波算法不具有的对非线性信道进行估计建模的能力,而且,通过引入切换机制,其能够很好地平衡收敛速度和运算复杂度之间的关系,是一种适于工程实现的NLAEC解决方案。