论文部分内容阅读
通过近年来的一些研究,人们对于理解视皮层信息处理的基本原理已经取得了巨大的进步,从而使得自底向上的注意引导备受国内外研究者的关注,并成功地建立了一些模型。但是,关于自顶向下注意引导的研究却遇到了一些困难。目前,大多数模拟自顶向下视觉注意机制的感知模型都是在原有的自底向上注意感知模型的基础上经过改进得来的。出发点是基于自底向上注意的数据信息,有一定的局限性。因此,研究自顶向下的注意感知理论并建立相应的模型已成为当前视觉感知系统信息处理理论中的一个亟待解决的问题。研究视觉感知系统信息处理理论的一个主要内容涉及目标对象和空间位置感知,其实质就是研究两个视觉子系统what通路和where通路的功能。因此,本文以视觉通路理论为指导,构建自顶向下的视觉注意感知模型,探索视觉感知的新理论。在正常的人类视觉中,自底向上和自顶向下处理过程的结合将会影响我们的注意,并将注意吸引到显著的相关场景部分。所以,我们强调的模拟自顶向下的注意感知,实际上是一个自下而上和自上而下的有机融合和相互作用的过程。本文将与where通路相关的空间位置感知分成两个层次的概念:目标所处的空间环境和目标所在视觉空间中的具体位置。用目标所处空间的大范围信息——环境信息作为where通路中传输的一级where信息,用目标在视觉空间中的具体位置作为二级where信息。将what通路中传输的目标感知信息作为what信息。与注意机制相结合,一级where信息可以用来驱动自顶向下的注意,处理大范围环境空间信息,为目标感知提供指导。二级where信息与what信息一起可以用于驱动自底向上的注意,形成感受和进行对象识别。本文主要创新点有:第一,提出了一种新的自底向上的注意信息提取算法(Integration of localcomplexity and early visual features,LOCEV)。LOCEV算法综合考虑了三方面特性来定义显著性:1.根据特征空间中的不可预测性来衡量特征的复杂度;2.在尺度空间中衡量特征的统计不相似特性;3.同时考虑特征空间和尺度空间,衡量特征的一些初级视觉特性。得到的显著区域在特征空间和尺度空间中同时显著。图像中所有的点在对应尺度下的区域显著值构成了整幅图像的what信息,其中的位置信息和尺度信息就构成了对应的二级where信息。获取的自底向上的注意信息具有旋转、平移、比例缩放不变性和一定的抗噪能力。第二,提出了一种新的以环境为中心的一级where信息提取算法(Context-centered first level where information extraction,CONCEN)。CONCEN算法分为三个阶段:1.提取一级where信息的高维编码;2.对一级where信息高维编码进行子采样处理;3.计算高维编码子采样输出的统计特征。将最终的统计特征系数定义为一级where信息,结合注意机制,一级where信息可以用来驱动自顶向下的注意,处理大范围环境空间信息。CONCEN算法定义的一级where信息不是以目标为中心的局部信息的简单叠加,而是将整个场景看成一个独立目标得出的真正意义上的环境信息,既保留了原始场景环境的全局结构信息,又反映了空间、频率和朝向特性。根据一级where信息获得相关目标的先验知识,用于指导与wha信息和二级where信息相关的自底向上的注意。第三,提出了一种新的基于what和where信息的视觉感知模型(Wha andwhere information based visual perception model,WHAT-WHERE)。WHAT-WHERE模型采用以环境为中心的一级where信息进行自顶向下的注意控制,指导what信息和二级where驱动的自底向上的注意。自顶向下的注意包括预注意和集中注意两个阶段,预注意依据一级where信息为特定目标出现与否提供先验,做出是否继续搜索的判定。集中注意的结果与what信息和二级where信息相结合,将注意指向目标最有可能出现的图像区域,即集中注意区域,并得到了图像集中注意区域中的当前显著目标区域和显著目标区域转移的潜在目标。在显著目标区域转移的过程中,提出了一个新的目标转移准则——吸引力。根据各潜在目标区域对当前显著目标区域吸引力的大小,确定下一个待注视的显著目标区域和相应的潜在目标。以此循环,并得到一系列显著目标区域。一级where信息既可以为哪种目标最有可能出现提供很强的先验,也可以为图像中期望的目标出现的位置提供先验,从而可靠地指导自底向上的注意。WHAT-WHERE模型在预注意完成后根据条件就可以停止整个检测过程,从而在很大程度上节约计算资源。将集中注意的结果与what信息和二级where信息相结合,为将注意集中到与目标相关的显著区域提供了有效机制。