论文部分内容阅读
头相关传输函数(HRTF)描述了自由场的情况下,声波从声源到双耳的传输过程。它在双耳听觉等基础研究和虚拟声重放等实际应用中具有重要的作用。 目前,国外已建立了一些HRTF数据库,并对HRTF的基本特性进行了研究。然而,现有的许多数据库在受试者样本、空间采样率等方面存在不足;并且,由于HRTF与受试者的生理结构以及尺寸有关,不同民族的生理结构和尺寸有所不同,因而基于西方人样本的一些统计结果并不一定适合中国人,而国内还没有开展这方面的研究。本论文涉及HRTF的基础研究工作。论文的第一项工作是中国人样本HRTF数据库的建立和基本特性的研究。通过对52名受试者(男、女各26名)进行实验测量,建立了高空间分辨率的HRTF数据库,以及描述受试者头部、耳廓特征的17个生理参数的数据库。在此基础上,对与声源定位有关的因素进行了分析;证明了性别对最大双耳时间差有显著的影响,因而相关的研究应分别建立适合男性和女性的模型,至少应选择等量的男、女性受试者的数据进行统计平均,否则就会出现偏差。进一步地,通过与国外CIPIC HRTF数据库进行比较,证明了中国人样本的最大双耳时间差和主要基于西方人样本的统计结果存在显著的差异,因此建立中国人样本的HRTF数据库是必要的,而直接引用国外数据进行中国人双耳听觉的研究可能会出现偏差。此外,本文还研究了不同衣服对肩部反射以及HRTF的影响,发现耳廓可以消除或减少不同衣服对肩部反射和声源定位的影响,使得3.0 kHz以下的肩部反射能够成为一个稳定的声源定位因素。
本文的第二项工作是提出了HRTF的空间傅立叶分析法,得到了HRTF的空间采样定理和一种不同纬度面上HRTF的插值方法,给出了各确定纬度面上恢复方位角连续的HRTF所需要的最小空间采样点数;同时证明,在最小相位近似下,所需要的最小空间采样点数较少,因而可使测量和数据库简化。对新HRTF数据库的实际空间采样率进行了验证,结果表明新数据库所采用的空间采样点数是足够的。对新的HRTF插值方法的效果进行了验证,发现当声源在被研究耳的同侧时的插值误差普遍比异侧时的小。此外,本文还提出了利用RBF神经网络预测低纬度未测方向的HRTF。计算表明:已知数据越多且距离预测点越近,预测的效果越好。 论文的第三项工作是研究了HRTF的空间对称性。结果表明:对于真人,f>2.5kHz就开始出现前后不对称,而f≥5.5kHz才开始出现左右不对称。分析指出,耳廓主要破坏HRTF的5~6kHz以上的前后对称性,而双耳的位置在较低的频率(2.5kHz)就开始影响前后对称性。由于不同个体的生理细节存在差异,因而其HRTF空间不对称的起始频率以及程度有一定的差异。对KEMAR的HRTF数据的研究表明,由于KEMAR的双耳位置以及其它生理细节和真人有所不同,因而KEMAR听觉模型不能完全适用于真人。另外,计算表明:HRTF刚球模型的适用频段大约为f≤2.5kHz;模型中双耳的位置对于计算结果有着明显的影响。
论文的第四项工作是分析了双耳时间差与生理参数的关系,并采用多元线性回归的方法建立了具有统计意义的双耳时间差模型。模型反映了双耳时间差的左右对称性和前后不对称性,利用描述头部以及耳廓主要特征的三个生理参数,即可预测出水平面的双耳时间差。对库外四名受试者预测的结果表明:新模型的各方向平均总误差不大于20μs,总体预测效果较好;但是侧向的预测效果不及前后方的预测效果。
本文的工作不仅丰富和深化了HRTF的理论研究,还为今后国内有关双耳听觉的研究和虚拟听觉的应用提供了基础。