论文部分内容阅读
麦克风阵列在人们的日常生活中扮演着重要的角色,基于麦克风阵列的波达方向(DOA,Direction of Arrival)估计的应用也日益广泛。但目前主流的DOA估计算法普遍存在一些缺陷,例如在信噪比低、混响强的环境中性能下降严重,估计算法的计算复杂度高,阵列误差情况下算法失效等问题。为了解决上述问题,本文研究了卷积神经网络在麦克风阵列DOA估计方面的应用,卷积神经网络是深度学习中一种具有代表性的神经网络,深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示,使用深度学习的DOA估计算法相较与传统算法不仅在低信噪比和混响条件下有更强的鲁棒性,并且对阵列误差条件下具有相当强的稳健性。本文研究了卷积神经网络及其改进网络在DOA估计问题中的应用,主要针对噪声、混响和阵列误差条件下性能下降的问题,主要工作如下:1、研究了一种基于卷积神经网络的多窄带声源DOA估计算法,通过数个基于CNN的自动编码器,将DOA估计范围分为对应数量的子区间,再通过由CNN构成的多任务分类器,得到空间谱结构的DOA估计结果。算法在低信噪比下的多声源DOA估计问题上有很强的鲁棒性和准确性。2、使用残差神经网络对噪声和混响条件下的麦克风阵列信号DOA估计,提出使用基于欧几里得距离的代价函数进行回归建模,使DOA结果更直观,在恶劣环境下的性能优于其他深度学习的DOA估计算法。在此基础上,在阵列误差条件下对DOA估计算法进行了测试,使用残差网络的DOA算法稳健性要明显强于其它算法。3、出于加速神经网络训练过程,简化神经网络结构的目的,研究了一种基于受限玻尔兹曼机自动编码器的数据压缩结构,自动编码器使用纯净-嘈杂数据对作为数据集训练,有效地解决了神经网络算法训练缓慢的问题,提升了强噪声环境中的DOA性能。4、在消声室环境下搭建了实测实验平台,分别测试了上述三种算法的性能。