论文部分内容阅读
随着科技的发展,远距离拾音技术在智能家居、安防、机械控制等领域的需求日益增长。伴随着拾音距离的增加,声音中混入的噪声和干扰成分也随之增多,多径传输带来的混响、衰落等因素也都会造成目标信号的失真。传统单通道语音增强方法只利用了时-频域信息,因此在面对时频交叠性强、空间区分大的多声源情况时,表现并不尽如人意,而基于传声器阵列的语音增强是提升该场景下目标语音质量的一个重要技术手段。 除了时-频域处理,阵列还具备空间滤波能力,因此为抑制目标方向之外的干扰和噪声提供了另一维度的可能,比起单通道方法而言具有更大的优势。阵列语音增强方法还面临许多值得深入研究解决的难题。拾音距离变远的同时,伴随着环境干扰和噪声的增加,信噪比随之减小,带来处理上的困难。如何高质量地从采样声音数据中提取出感兴趣方向的目标语音,同时又能兼顾运算效率以满足实时处理需要,仍然是当前远讲语音增强领域需要不断探索的课题。 本文主要研究了远讲阵列语音增强方法中的波束形成算法,以及多通道后滤波算法。对针对较大规模阵元数量,研究了基于稀疏约束快速迭代波束形成方法,主要研究工作和创新点包括: 1.在总结了常用的阵列波束形成方法的基础上,提出了一种波束比因子语音增强方法,该方法利用了DAS波束形成器和MVDR波束形成器的空间波束能量差异,将其应用到阵列协方差矩阵对角加载方法中,改进了MVDR波束形成算法,提出的方法在维持了低复杂度的前提下,取得了更高的信干噪比及更优的语音质量。 2.在总结了经典的多通道后滤波算法的前提下,提出了一种较以往的Zelinski和McCowan后滤波算法更为合理的噪声估计方法,应用于多通道后滤波中,改进了算法性能。提出了一种利用空间多波束能量方程组来估计目标声源能量的方法,该方法较以往方法而言是一种新的思路,通过对比也展现了良好的后滤波性能。 3.为增大拾音距离,研究了阵元数较多情况下的波束形成方法,传统方法由于滤波能力或者复杂度等原因难以胜任该情形。根据所提出的方法,采用稀疏约束方法,不仅可以节省运算量,还可以取得更快的收敛速度、更鲁棒的算法性能。