论文部分内容阅读
数字助听器能够有效改善听损患者的听力水平,声源定位是数字助听器中的核心算法之一。本文重点研究数字助听器中的声源定位算法,并提出了改进算法。论文的主要工作包括:(1)研究了数字助听器的基本工作原理,详细阐述了语音增强、响度补偿以及回声消除等数字助听器中的关键技术。对当前常用的声源定位算法进行分析和比较,最终选择运算量低、实时性好的基于时延估计的声源定位算法作为本文重点研究的定位方法。详细介绍了语音信号数字模型、房间脉冲响应模型,并分别建立麦克风接收信号的理想模型和实际模型。(2)重点研究了当前广泛应用的广义互相关(Generalized Cross Correlation,GCC)时延估计算法,讨论了其各种加权函数的性能特点,并进行仿真实验分析。针对GCC法的缺点,结合相关峰精确插值算法(Fine Interpolation of Correlation Peak,FICP),提出了基于二次相关改进的广义互相关时延估计算法。仿真实验表明,与传统GCC法相比,改进算法具有更高的抗噪声性能和时延估计精度。(3)深入研究了互功率谱相位(Cross-power Spectral Phase,CSP)时延估计算法。针对CSP法在强噪声和混响条件下性能下降严重的缺点,提出了改进的CSP法。改进算法引入语音端点检测(Voice Activity Detection,VAD)来去除非语音帧,减少运算量的同时降低了噪声和混响的干扰,并引入一个非线性白化参数来对加权函数进行改进,然后通过多帧累加互功率谱相位来得到估计时延,进一步锐化相关函数的峰值,提高时延估计的精度。(4)对定位方法进行了系统的研究并进行设计实现。简单介绍了几何定位法和目标函数空间搜索定位法的原理和特点,然后设计了一个四元麦克风阵列的定位模型。该模型时延估计模块采用基于二次相关改进的广义互相关时延估计算法,而定位模块采用的是空间几何关系定位法。仿真实验表明,该系统模型实现简单,运算量低,具有一定的可行性。