论文部分内容阅读
可听化是指通过物理、数学的方法,模拟出聆听者所在的声场环境,并通过声音的重放让聆听者有身临其境的听觉感受。而双耳可听化特指通过双耳信号的重放来实现的可听化,是当前应用得最为广泛的可听化技术。双耳可听化技术在厅堂音质主观评价、虚拟听觉实验、虚拟现实等方面有着广泛的应用。但实际应用中发现可听化效果与实际听音有差异,这引起了国际上研究的关注。然而相对于双耳可听化技术的应用,探讨影响双耳可听化质量方面的研究非常少,而且在很多问题上都还没有统一的定论。目前国内尚未见这方面的系统研究。本文首先综述可听化技术的研究进展和影响双耳可听化质量因素的研究进展,介绍双耳房间脉冲响应(BRIR)的测量方法。然后根据双耳可听化的模型和实现步骤,探讨声源指向性、个性化双耳房间脉冲响应以及双耳信号的耳机重放等三个方面的物理因素对双耳可听化质量的影响。由于本文是通过测量手段来获取双耳房间脉冲响应(BRIR),因此在第二章专门介绍了测量脉冲响应的最大长度序列MLS方法。同时分析了影响MLS测量精度的因素,提出了从减少非线性失真、避免系统特性的时变、提高信噪比等三个方面来提高MLS测量精度。在声源指向性的影响方面,通过测量12面体无指向声源和有指向声源的房间脉冲RIR和双耳脉冲响应BRIR,从主客观两个方面来比较两种不同声源产生的双耳可听化质量的差异。客观比较发现,声源指向性对T30、EDT无显著影响,而对C80以及STI、IACC有显著影响。主观试验发现,指向性声源产生的主观距离感比无指向声源的近;指向性声源产生更清晰的主观听感。通过主观试验比较了个性化BRIR和非个性化BRIR的可听化差异。结果发现,受试者主要通过音色对两者的差异进行判别,而音色差异主要体现在6kHz以上的高频。由此可见,个性化BRIR对双耳可听化质量的影响是不能够忽略的(特别是对于使用了含有丰富高频成份的音乐素材的情况下),采用个性化的BRIR对双耳可听化是必要的。利用Moore双耳响度模型分析个性化与非个性化BRIR的响度谱差异。结果发现,响度谱差异主要表现在高频,特别是在34~36 ERB number(8.6 kHz ~10.7 kHz)范围内,这主要是由不同被测对象的耳廓频率谷点的差异引起的。响度级谱的最大差异都超过了1 phone/ERB,这表明差异是可被感知的,验证了主观听音试验结果。在研究耳机重放中出现的声像定位前后混乱问题时发现,在本文的试验条件下,采用个性化BRIR合成的双耳信号出现前后混乱的概率并不比采用非个性化BRIR合成的双耳信号低。从这一结果来看,要解决声像定位的前后混乱问题,采用个性化聆听者模型还是不足够的。对三种不同类型的耳机进行了耳机传输特性测量重复性的研究。结果表明,耳机传输特性测量的重复性与佩戴时对耳廓造的压迫性形变有关,在双耳可听化中适宜采用耳罩内空较大的耳罩式耳机。最后研究了非个性化的耳机传输特性补偿问题。结果发现,不恰当的非个性化耳机补偿方法不但不能够起到应有的作用,还会产生负面的作用,对双耳可听化的高频音色造成很大的影响。本文的研究成果可以为改善双耳可听化技术提供了思路和实验数据的支持。