论文部分内容阅读
虚拟听觉空间(VirtualAuditorySpace,简称VAS)可以根据人类心理听觉特征,通过双声道播放系统再现声源的空间信息。与头相关传递函数(HeadRelatedTransferFunctions,简称HRTFs)描述了声波从声源到耳道口的传播特征,反映了外耳、头部和躯干等身体结构对来自不同方位声音信号的滤波效果;与之对应的时域表示称为与头相关脉冲响应(Head-RelatedImpulseResponse,简称HRIR)。因此,HRTF既与声源相对于听者的方向有关,同时也因人体部位形状及大小的不同而存在很大的个体差异。基于HRTF的VAS可以通过信号处理技术,利用HRTF将声音定位在空间的不同方位,只需一对耳机(或者扬声器)就可以实现声音空间信息的重放,设备简单,成本低。VAS已广泛应用于多媒体计算机,医学研究应用,军事战场模拟,残障人员的导航系统,驾驶模拟训练,指挥控制系统以及智能机器人的开发等许多领域。但是现有的VAS实现中还存在很多技术有待改进,比如HRTF数据本身就是决定基于HRTF的VAS合成效果的主要因素之一。目前绝大部分空间听觉系统都是基于通用HRTF实现的。这种方法忽略了HRTF的个体差异,常常会因为听者自身的HRTF与通用HRTF不匹配而产生失真,如较严重的头中效应、前后颠倒以及仰角误判等现象。因此,如何获得因人而异的个人化HRTF是合成理想VAS的前提,也是实现具有较高听觉感知度VAS的关键所在。理论上要得到个人化的HRTF就必须测量每个人所有方向的HRTF,这不仅需要专门的设备和技术,而且测量过程复杂耗时,难以实际应用。因此,如何通过简单的方法获取一套合适的HRTF是目前VAS的一个研究热点,具有很大的研究价值。
本文主要在HRTF的个人化及基于耳机虚拟声系统的外部化两方面展开研究。在该领域已有研究成果的基础上,提出了三种HRTF的个人化方法,并通过联合使用个人化HRTF和环境线索实现了耳机VAS系统的优化,具体包括以下几方面工作:
第1章,介绍了耳朵的结构、听觉感知系统传输特性和空间听觉定位原理,并讨论了基于HRTF的耳机重放VAS合成的原理、应用和实现中存在的问题及其可能的解决方案。
第2章,回顾了近30年中,在一些国际期刊和会议上发表的关于HRTF及其个人化方面的文章,在此基础上讨论了HRTF个人化研究的必要性以及目前已有的一些个人化方法。
第3章,介绍了HRTF数据库,并分析了该数据库中HRTF数据的结构特征,进一步验证了VAS中使用个人化HRTF的必要性;然后对该数据包提供的HRTF数据和相应人体参数进行了统计分析,选出了几个与HRTF主要特征相关较大,且对正确感知影响较显著的人体参数,为后面通过人体参数进行HRTF个人化奠定了基础。
第4章,在早期个人化研究和论文前面章节分析的基础上,提出了基于最小二乘多元线性回归的HRTF个人化方法。由该方法估计的个人化HRTF的主客观分析结果都优于非个人化HRTF。
第5章,对多元线性回归的个人化方法进行了改进,提出了基于偏最小二乘回归的HRTF个人化方法。客观误差分析和主观声音定位测试结果表明:估计的HRTF与实际测量的HRTF之间不仅均方误差较小,而且感知区别不大;同时由偏最小二乘回归估计的个人化HRTF在水平面上的主观测听定位准确率明显优于非个人化HRTF,也优于由最小二乘回归估计的个人化HRTF。
第6章,考虑到身体结构对声音复杂的散射作用,采用了基于神经网络的非线性回归模型来描述HRTF和人体参数之间的非线性关系,得到了比最小二乘和偏最小二乘多元回归更精确的个人化HRTF模型。
第7章,讨论了若干和耳机重发空间声音有关的问题,比如头中效应现象和声像定位不精确等问题。在回顾了关于头中效应产生原因及其解决方案等方面的文献后,结合已有混响算法和第6章提出的个人化HRTF方法,提出了一种声像外部化方法,从而使得产生的虚拟声不仅有较精确的感知定位性能,而且有较明显的外部感。