论文部分内容阅读
Ambisonics三维音频技术可以采用不同的扬声器阵列实现二维(Two-dimensional,2D)或三维(Two-dimensional,3D)声像的重放。然而,在不规则扬声器配置下,采用逆矩阵法所得的重建声像定位质量较差。为提高重建声像定位质量,本文基于ITU-4、ITU-5和Auro-10不规则扬声器配置,研究Ambisonics声像重放的优化方法。本文的研究成果可以总结为以下几个方面:首先,在采用一阶Ambisonic实现2D声像重放时,由于低频目标在多目标优化中占有支配性,从而导致了重建声像的高频定位质量较差。针对这一问题,本文采用基于加权比例和遗传算法的方法来自动去除低频目标的支配性,充分优化高频目标,从而提高重建声像的高频定位质量。在ITU-4扬声器配置下,所提方法的一阶重建声像高频定位质量得到了有效提高。双耳声级差(Interaural Level Difference,ILD)的客观测试表明,本文方法的重建声像在高频听觉感知度上比参考算法更接近真实声源。其次,在采用高阶Ambisonics(Higher-order Ambisonics,HOA)实现2D声像重放时,因为待优化参数不断增多,所以导致了遗传算法收敛性能的下降。针对这一问题,本文提出了基于最优对称虚拟传声器响应的HOA声像重放的优化方法。该方法使待调整的系数减少了一半,并使遗传算法收敛于听觉感知度更好的对称虚拟传声器响应。在ITU-5扬声器配置下,所提方法的四阶重建声像定位质量得到了有效提高。双耳时间差(Interaural Time Difference,ITD)和ILD的客观测试表明所提方法的重建声像听觉感知度较参考算法更接近真实声源。最后,本文研究了基于Auro-10扬声器配置的3D Ambisonics声像重放方法。针对固定3D扬声器增益参数不能同时较优地实现各方向声像重建的问题,提出一种基于空间方位格点量化技术(Spatial Localization Quantization Point,SLQP)的多增益融合声像重建方法。对Ambisonics信号中的原始声源进行方位估计并量化至SLQP格点上,用多组扬声器增益参数分别重建各量化方位上的声像。最终得到的3D重建声像定位质量优于传统固定增益参数方法。