论文部分内容阅读
二十世纪中期以来,三维音频重放方法的研究是各国音频研究者的研究热点。2012年,动态图像专家组(Moving Pictures Experts Group,MPEG)盼三维音频标准定义的提出,进一步提升了三维音频研究的热度。近年来,三维音频重放方法的研究虽取得了很多的进展,但仍存在一些问题,例如Ambisonics音频系统因不能精确的恢复重建声场中的距离信息从而无法实现距离重现。针对以上问题,本文在对Ambisonics重放系统和人耳听觉感知理论深入研究的基础上,结合复杂声场分析和基于球谐展开的镜像模型(Image Model,IM)基本原理,提出了距离提取及重现方法,在原始Ambisonics音频的基础上,实现Ambisonics音频的距离重现。 本文的研究工作主要体现在以下几个方面: 首先,针对音频距离参数提取的不足,提出了一种基于复杂声场分析的多声道音频相对距离估计方法。该方法应用复杂声场分析,将构成再生声像的声源按照弥散程度分为主音成分与背景音成分两部分,并求取主音分量与背景音分量间的主音-背景音能量比。结合人耳听觉距离感知原理,依据主音-背景音能量比与相对距离间的映射关系,估计多声道音频中的相对距离。该方法通过对多声道音频复杂声场分析深入研究,在现有Ambisonics音频的基础上,实现了多声道音频的相对距离估计,主客观测试表明,本文所提方法能够准确估计相对距离且与人耳感知较为吻合。 其次,针对现有Ambisonics重放系统未对距离信息进行处理的问题,提出了一种基于球谐展开IM的Ambisonics音频距离重现方法。该方法将球谐函数展开的IM引入到Ambisonics重放系统中,通过声场叠加获得真实声源与镜像声源共同产生的带有反射声的目标声场,并求取对应的扬声器驱动函数。从而实现重放端反射声的合成,增加重放音频的距离线索,即直达反射能量比(Direct-to-Reverberant Energy Ratio,DRR),达到Ambisonics音频距离重现的目的。通过主客观测试可知,该方法能够较好的恢复目标声场并有效重现距离信息。 最后,本文通过对人耳听觉距离感知原理以及双耳听觉特性的研究,提出了一种基于头相关传递函数的距离提取与重现方法。该方法将通过复杂声场分析后估计所得的相对距离作为距离参数,结合基于球谐展开IM的Ambisonics距离重现方法,得到含有距离信息的Ambisonics重放信号。通过多声道音频加权叠加,采用头相关传递函数获得含有距离信息的双耳重放信号,实现双耳重放系统中人耳感知距离的重现。由主观测听可知,该方法在一定程度上能够实现双耳信号的距离重现。 本文在客观声场测试以及主观距离感知测试中对各种方法进行了性能测试。测试结果表明,本文所提方法能够有效提取音频中的相对距离参数信息,能够有效增强Ambisonics音频中的距离感。