论文部分内容阅读
空间声的目的是再现声音的时间与空间信息,给倾听者产生各种不同的听觉感知。空间声是声学、信号与信息处理方面的前沿课题,并在影音重放、多媒体与虚拟现实、通信、计算机与互联网等方面有重要的应用。目前空间声的一个发展趋势是增加重放通路,以改善重放声音空间信息的能力。但这同时也使系统及其扬声器布置变得复杂,给电视、多媒体计算机以及家庭影院等实际应用带来困难。为了适应不同的实际应用,需要发展通用的多通路空间声,而向下混合是通用的多通路空间声的一个重要技术问题,其关键是利用适当的听觉信息处理和信号处理原理,在简化重放的同时减少向下混合引起的声音信息丢失和音色缺陷问题。已有的向下混合方法主要分为传统的向下混合和基于虚拟重放的向下混合两大类。传统向下混合方法是将较多通路的信号进行与频率无关的线性组合,形成较少通路信号并用较少量扬声器重放。这类方法的信号处理相对简单,但现有的方法经常会导致明显的空间信息丢失,特别是向下混合为水平面通路重放时将完全失去三维(垂直)方向的空间听觉效果。基于虚拟重放的向下混合是通过听觉传输信号滤波处理,用少量真实扬声器产生较多的虚拟扬声器而实现多通路空间声重放。虽然现有的这类方法可以在一定程度上减少空间信息的丢失,但垂直方向信息丢失的问题依然存在,并且信号滤波处理会引起重放音色改变等问题。因而现有的向下混合方法仍存在一定的问题,特别是空间信息丢失的问题。目前国际标准化组织(ISO)和国际电工委员会(IEC)有关多通路空间声的标准对向下混合方法是开放的,这为改进向下混合方法提供了条件。为解决上述问题,本学位论文对多通路空间声向下混合重放的听觉信息处理机理和信号处理原理进行了系统的研究,提出了减少重放中空间信息损失和音色缺陷的系列方法。本文的具体工作包括以下方面。第一项工作是对传统立体声重放中一个听觉现象的机理进行了实验研究。在水平面前方立体声重放中,当左、右扬声器布置过宽时,会出现正前方虚拟源向上提升的听觉现象与缺陷。早在1959年,就有研究提出了这是由于不匹配的双耳动态定位因素引起的理论假设。但该经典理论假设一直未得到严格的实验验证,成为一个有历史争议的问题与难题。本项工作设计了严格的心理声学实验,对模拟立体声重放的双耳动态定位因素进行人工控制与补偿,以检验动态定位因素对感知虚拟源仰角的影响。实验结果表明通过动态因素控制和补偿可以改变感知虚拟源的仰角,且在完全补偿的情况下,可以完全消除正前方虚拟源向上提升的听觉现象。因而本实验准确验证了上述经典理论假设,并且其结论可反过来应用于多通路空间声向下混合系统的设计。第二项工作是进一步提出了一种在多通路空间声向下混合重放中,利用水平面扬声器布置产生垂直(三维)方向虚拟源的方法,以解决多通路空间声信号向下混合到水平扬声器布置重放时,虚拟源通常只能局限在水平面的问题。利用动态双耳定位因素引起感知虚拟源仰角提升的机理,研究设计了一种信号馈给方式,使得仅利用水平面扬声器布置就可以产生不同仰角的垂直虚拟源感知。以国际电信联盟(ITU)推荐的5.1通路环绕声的扬声器布置为例,实现了该方法,并进行了虚拟源定位实验验证。结果表明该方法确实可以产生垂直虚拟源感知效果,从而减少了多通路空间声向下混合时引起的垂直信息丢失的问题。第三项工作是对水平面前方两扬声器稳态虚拟重放的定位因素进行了分析,证明了其在产生后方和垂直方向虚拟源方面的局限性。许多研究试图采用水平面两扬声器稳态虚拟重放产生整个水平面、甚至三维空间(包括垂直方向)的虚拟源,但一直没有成功。本项工作采用头相关传输函数模型以及虚拟源定位实验证明了两扬声器稳态虚拟重放只能产生与前半水平面声源相匹配的动态定位因素以及虚拟源,而两扬声器动态虚拟重放对动态因素进行控制和补偿后,则可以产生与后方和垂直声源相匹配的动态定位因素以及虚拟源。因此研究阐明了两扬声器稳态虚拟重放的局限性及其机理,证明了它不可能产生后方和垂直方向的虚拟源。其结论可用于向下混合的设计。第四项工作是基于第三项工作的研究结论,提出了一种四扬声器虚拟重放系统以实现前方多通路空间声信息的向下混合重放。本项工作基于动态因素对垂直定位的机理,设计了重放扬声器的布置以及信号处理方法。并以9.1通路空间环绕声的四扬声器虚拟(向下混合)重放为例,对所提出的方法进行了理论分析和实验验证。通过双耳声压所包含的定位因素进行分析,结果表明该方法可以产生正确的双耳时间差及其随头部转动的变化,从而产生合适的侧向定位双耳因素和垂直定位的动态因素。虚拟源实验结果表明,该方法可以产生前半球一定范围内的虚拟源感知,包括水平方向和垂直方向的虚拟源感知,从而改善了向下混合重放的效果。第五项工作是提出了一种改善虚拟重放的音色均衡信号处理方法。当把虚拟重放用于多通路空间声向下混合重放时,通常会出现重放音色改变,从而影响到该方法的实际应用。本项工作在对虚拟重放音色改变的原因与机理分析的基础上,提出了一种高频带音色均衡方法。并使用修正的Moore’s响度模型客观分析了所提出的方法,结果表明本方法可以有效的减少虚拟重放的双耳响度级谱与目标虚拟源的响度级谱之间的偏差。进一步的心理声学主观实验验证了所提出的方法在不影响虚拟源定位的条件下,进一步地减少了音色的改变。本文工作是对多通路空间声的传统向下混合和虚拟重放的一个综合的研究,在听觉信息处理机理与信号处理原理研究的基础上,着重解决了重放中空间信息(特别是垂直空间信息)的丢失和音色改变两个重要问题,为今后实际应用提供重要的参考。