论文部分内容阅读
听觉研究面临的一个重要问题是在嘈杂混响环境下听者是如何识别目标声源的。本论文同时采用心理物理、事件相关电位(ERP)以及功能磁共振成像(fMRI)三种实验手段针对这个问题进行了跨加工层次的研究。
在早期感觉加工阶段所进行的心理物理和ERP的研究均表明,听觉系统对声波精细结构存储的初始听觉“记忆”是一个随时间而衰减的动态变化过程,该过程受到声音频率和双耳延迟的影响。高频精细结构的初始听觉“记忆”随时间的衰减速度快于低频精细结构的衰减速度。
混响环境下不仅存在声源发出的直达声波,还存在周围物体表面等对这些直达声的反射声,并且反射声总是落后于直达声到达人耳。因此,听觉系统必须利用初始听觉“记忆”中所保持的直达声波的信息与反射声波进行相关性“计算”,然后通过特征“捕获”的方式对直达声和反射声进行知觉整合,以形成单一听觉事件的知觉。听觉系统对直达声和反射声进行知觉整合的倾向性受到声音类型的影响:言语的知觉整合倾向性高于噪声的知觉整合倾向性,也就是言语的回声阈限大于噪声的回声阈限。言语在时间轴上的即时幅度波动以及幅度波动的载体在该过程中都起到重要作用。并且,大脑对言语知觉整合的加工具有特殊性:当正常语句的直达声和反射声之间的时间间隔从40 ms减小到2 ms时,左侧MTG(BA21)和右侧ACC(BA32)的激活程度显著增加。言语的知觉整合会增强大脑对言语中“客体(what)”和“空间位置(where)”信息的加工:在直达声和反射声知觉整合较好的条件下,相对于反转语句而言,正常语句在左侧STG前部靠近STS的位置(BA38)、右侧IPL(BA4.0)、以及右侧ACC(BA32)引起的激活程度较大。
在有干扰声源存在的环境下,听觉系统对目标声源直达声和反射声的知觉整合可以带来声源声像在知觉上的分离,从而帮助听者对目标声音进行选择性注意,提高对目标的加工和识别。随着目标直达声和反射声之间的时间间隔从0 ms逐渐增加到64 ms,听者对直达声和反射声的知觉整合程度逐渐降低。知觉整合可以带来各个声源在知觉上的分离,从而带来掩蔽减少量;而掩蔽减少量随直达声和反射声知觉整合程度的降低而降低。并且,听者对目标直达声和反射声进行知觉整合带来掩蔽减少的能力与他们对声音精细结构尤其是低频精细结构(200和400Hz)的初始听觉“记忆”能力存在显著的功能相关。
老年人在嘈杂混响环境下会面临更大的言语识别困难。我们针对老年人这个特殊群体的研究表明,老年人对声音精细结构进行保持的初始听觉“记忆”的能力比年轻人差,尤其是在有较大双耳时间延迟的条件下。而且老年人在言语掩蔽条件下对目标直达声和反射声进行知觉整合的最大有效延时小于年轻人的最大有效延时。
因此,在嘈杂混响环境下,听觉系统需要对声波的精细结构进行存储以便对直达声和反射声进行有效的知觉整合,带来各种线索帮助听者在知觉层次上对目标声音和干扰声音进行分离,从而提高对目标声音的探测和识别,达到去掩蔽的作用。