论文部分内容阅读
视觉场景包含着非常复杂的信息与多种层次的属性。尽管目前计算机视觉由于深度神经网络的兴起在场景识别等方面发展迅速,但其对大量人工标注的样本的依赖和漫长的训练时间都限制了它的实际应用。而人类却能快速准确地理解场景。因此,探究人类对场景的认知和神经机制,将进一步地为计算机视觉提供借鉴与启发。本文利用功能磁共振成像(functional magnetic resonance imaging,fMRI)技术通过两项实验,分别研究场景的中级属性——物体以及低级属性——空间频率在人脑中的作用机制。第一项实验通过分析显著性物体遮挡后人类在场景分类中的大脑机制,发现物体选择区域侧枕叶(lateral occipital complex,LOC)与默认模式网络(default mode network,DMN)中处理注意力的区域的交互,背外侧前额叶皮层(dorsolateral prefrontal cortex,DLPFC)向LOC和其他外纹视觉皮层的自顶向下的调制作用,以及以左脑颞中回(middle temporal gyrus,MTG)为核心的区域网络的功能连接发生了显著的变化。以上结果说明遮挡显著性物体显著地影响了人类对物体的注意力、认知需求、自顶向下的调制作用以及语义判断。在第二项实验中,我们采用多体素模式分析(multivoxel pattern analysis,MVPA)的方法在不同亮度对比以及自然和室内场景下研究低空间频率(low spatial frequency,LSF)与高空间频率(high spatial frequency,HSF)对人类场景类别表征的作用。结果显示亮度对比会显著地影响空间频率在场景感知中的作用。同时我们发现人类对自然场景的识别更多地依赖低空间频率信息,而对室内场景的识别则更依赖高空间频率信息,这可能是由于人类在这两类场景中对全局或者局部空间感知的不同偏好决定的。本研究基于不同级别的场景属性,既在大脑机制方面首次揭示了场景理解中的高级认知区域与较低级的视觉区域的交互,同时也在场景的视觉属性方面表明低级属性会携带中级属性的重要信息从而作用于高级语义信息的理解。这些发现将有助于完善人类对场景感知与处理的完整层次结构。