论文部分内容阅读
麦克风阵列声源定位技术是语音信号处理领域中的研究热点之一。相对于单声源,多声源方位估计更具挑战性。传统的声源方位估计方法在小尺寸阵列条件下往往无法满足定位精度的要求。因此,如何在小尺寸阵列条件下有效实现多声源方位估计成为麦克风阵列信号处理领域中需要进一步解决的关键问题。差分麦克风阵列为实现小尺寸声阵条件下的声源定位提供了一个重要途径。本文研究了在混响噪声环境下基于差分麦克风阵列的多声源方位估计方法,具体工作和贡献包括:1、分析了现有的差分麦克风阵列多声源方位估计方法性能,包括直方图法和模糊聚类法。揭示了这两种方法存在的问题:直方图法对噪声较为敏感,而模糊聚类法对混响的鲁棒性较差。2、提出了差分麦克风阵列期望最大化多声源方位估计方法。该方法首先利用期望最大化算法求解出各个时频点瞬时方位估计所应满足的高斯混合模型参数;然后通过时频点分离技术估计出各个声源的方位值。针对现有的硬、软时频点分离技术应用于差分麦克风阵列所存在的缺陷,还提出了一种改进的时频点分离方法,该方法融合了软、硬分离所具有的优点,有效降低了时频点分离结果对混响噪声的敏感性。仿真和实测实验结果表明:相较于现有的差分麦克风阵列多声源方位估计方法,所提方法在混响噪声环境下具有更高的估计精度和稳健性能。3、提出了基于可靠时频点筛选和聚类的多声源方位估计方法。首先,该方法进行可靠时频点筛选,根据瞬时方位估计的局部方差可对时频点进行初步筛选,而利用差分阵列的冗余信息可进行时频点二次筛选,据此得到可靠时频点;其次,对可靠时频点二次筛选后相应的瞬时方位估计进行kmeans聚类得到各声源的方位估计。仿真和实测实验结果表明:与现有的差分阵列多声源方位估计方法相比,该方法在混响噪声环境下更加鲁棒。