论文部分内容阅读
为了获得逼真的3D音频效果,可以通过增加声道数量实现多声道数字音频系统。但是,声道数的增加伴随着音频数据量的增加,在存储容量有限,传输带宽受限的情况下,必然会降低对3D音频的重建效果。基于此,如何对多声道数字音频信号进行高效的编码,以便使用更少的码率来传输所需的数据成为3D音频研究的热点之一。传统的音频编码技术是基于单个声道的独立编码,这种编码方式随着声道数的增加将造成带宽的浪费。基于双耳线索的空间音频编码技术采用下混技术对多声道原始信号进行处理,得到下混的单声道信号以及表征声音空间信息的空间线索,用于表征声源的方位和声像宽度,包括双耳时间差(Interaural time difference,ITD)、双耳强度差(Interaural level difference,ILD)和耳间相关度(Interaural correlation,IC),可单独对其编码形成边信息进行信号传输。同时,在接收端,解码器将下混的单声道信号还原为多声道信号,同时将边信息中的空间参数还原。可以看出,采用空间编码技术进行编码时,其数据量将远远小于原始信号的信息量,降低了对存储空间和带宽的要求,又因保留了表征空间信息的空间参数,利用多声道回放技术,可以保证输出音频的高质量。利用双耳线索可以将声音的空间特性进行量化,相关学者也针对双耳线索感知特性进行了测量与分析,主要集中在对双耳时间差和双耳强度差感知灵敏度,即恰可感知差异(Just Notice Different,JND)值的测量。声音在三维空间中具有水平角,高度角和距离三种位置线索,理论研究表明双耳线索与声音的方位角θ、头部半径R和声速C存在相关性。有关学者对水平方位上特殊角所对应的ITD与ILD值进行了测试,但是总体测试点选择较少,且缺乏系统的感知分析,因此,必须做进一步的测试与分析。基于此,本文首先采用单频正弦纯音,利用人工头设备在消音环境中采集水平方位上8个频带的声音数据,建立测试音频样本库。基于空间心理声学设计测听软件,在低频段8个频率带上对双耳线索ILD和ITD分别取不同的值,测试在水平方位上的感知特性,参考JND的测试方法,获得双耳线索在水平面上方位角的恰可感知值(Just Notice,JN)。最后将所得的数据进行插值和拟合,得到双耳线索与方位角及频率的三维曲面和函数关系式。