论文部分内容阅读
基于传声器阵列的声源定位近年来被广泛的应用在生活与生产中,在视频电话会议、智能家居和噪声检测系统等多个领域受到广泛地关注与研究。然而,真实环境中的噪声和混响问题、算法实时性问题和传声器的数量依旧影响声源定位算法的效果,特别在混响环境下,如何利用较少数量的传声器进行准确快速地声源定位仍然是目前研究的热点和难点。基于上述问题,论文首先设计一种改进的语音端点检测算法,能更准确地从接收信号中提取语音信号,再设计一种改进的的倒谱滤波时延估计技术对语音信号进行时延估计,最后利用十字形传声器阵列结合时延估计进行声源定位。论文的具体工作体现如以下三点:1.谱熵法端点检测对信噪比不敏感,受信号能量影响小,然而当噪声与语音信号的谱分布相近时估计性能急促下降,为此设计出一种基于谱加权的谱熵端点检测算法。算法中通过引入一种频谱加权技术,对接收信号的频谱进行不同程度的白化,以达到改变噪声与语音信号谱熵值的效果,能通过检测谱熵值大小区分噪声信号与语音信号。经实验仿真证明,相比于谱熵法,谱加权谱熵法端点检测具有更好的估计性能,在白噪声下,两者都具有较好的检测性能;在其他类型噪声下,在信噪比为0dB-5dB时,正确率提升10%-50%;信噪比在5dB以上时,检测正确率提升30%左右。2.倒谱预滤波时延估计技术能有效的抑制接收信号中的混响成分,但由于消除了最小相位分量,使全通分量信号在幅度谱上进行了白化,未能有效利用信号幅度谱中携带的有效信息,使估计的峰值降低。为此论文设计一种改进的时延估计技术,在得到全通信号的基础上,加入信号幅度谱,并结合改进的相位加权广义互相关函数法进行时延估计。最后在三种不同混响时间的环境下进行仿真,进一步验证了本文算法比广义互相关时延估计算法具有更好的估计性能。3.一维线性传声器阵列具有结构简单、数学建模容易,所需传声器数量少的优点,但定位过程中会产生定位模糊问题,无法确定正确位置。为此论文设计一种具有四个传声器的十字形阵列,利用两对传声器的时延消除定位模糊问题,并结合波达角估计模型和时延进行波达角估计。最后在真实环境下设计共60组声源定位实验进行算法验证,进一步验证了本文算法具有更准确的估计性能。