论文部分内容阅读
麦克风阵列技术的研究与实现开始于20多年之前。麦克风阵列技术在通信、语音与话者识别、多媒体、声音控制系统、机器人技术、电视电话会议、视频会议系统、人机界面等许多领域具有广泛应用价值,是当前国内外语音信号处理研究领域的一大热点。传统的麦克风阵列技术主要适用于远场的窄带信号,研究针对近场宽带语音信号的近讲麦克风阵列成为目前的一个重要研究方向,特别在日益频繁的车载通讯、移动通讯等应用中,性能优越的近讲阵列急需被提出并走向实用。
本文介绍了适于近讲应用的差分阵列技术,在此基础上提出了聚焦近讲差分阵列,比较了聚焦差分阵列与其他几种阵列的指向性和抗噪性能。为了提高阵列的近场指向性,将以最优化指向性为目标的波束形成技术与差分阵列技术相结合,提出了最优化的聚焦差分阵列,使阵列同时具备良好的近场指向性和出色的远场抗噪能力。然后,对最优化差分阵列的语音增强性能进行了实验验证。实验结果表明,最优化的差分阵列具有较好的语音增强能力,并且可在一定角度范围内具备声源跟踪能力。提出的这种聚焦阵列结构未见其他文献报道。
在基于传统均匀线阵的远场GSC技术的基础上,针对麦克风阵列的近讲应用,提出了基于聚焦差分阵列的近场GSC技术。与远场GSC不同,近场GSC算法中的不同模块采用不同的输入信号,以利于提高自适应噪声抵消的效果。为了提高目标信号增强模块FBF输出中目标信号的纯净程度,使用—阶差分子阵列的输出作为FBF的输入。文中对时域GSC算法与频域算法的计算复杂度进行了比较,比较结果指出,当自适应滤波器长度较长时,频域算法以占用几倍与时域算法的存储空间为代价,其运算量比时域算法小得多。对于提出的近场GSC技术,文中进行了实验验证,实验结果表明:1)当麦克风阵列用于近讲语音增强时,基于聚焦差分阵列的近场GSC技术比基于均匀线阵的远场GSC技术的性能有较大提高。2)同样采用近场GSC技术时,阵元数较大的差分阵列效果较好。3)提出的近场GSC技术对于近场目标声源距离在一定范围内变化具有鲁棒性。
考虑到实际环境中物体的散射声场对阵列性能的影响,本文对类似手机体结构对装入结构的聚焦差分阵列性能的影响进行了初步分析。通过用刚性球模拟类似手机体的散射体,考察散射声场对阵列性能的影响。模拟计算与实验测量的结果都显示,刚性球的存在使得差分阵列在与阵列垂直平面内的指向性发生了一定的偏转。接着,对按不同方式装入手机体的几种阵列的语音增强效果进行实验验证。实验结果显示,随着基于差分阵列的近场GSC技术的采用,随着阵列尺度的增大,阵列的语音增强性能逐步得到提高。虽然装入手机的阵列性能比自由场中的阵列性能有一定的降低,但是将近讲差分阵列应用于手机通信以提高通信质量依然具有较大的实用价值。