模拟自顶向下视觉注意机制的感知模型研究

被引量 : 65次 | 上传用户:zhangsao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过近年来的一些研究,人们对于理解视皮层信息处理的基本原理已经取得了巨大的进步,从而使得自底向上的注意引导备受国内外研究者的关注,并成功地建立了一些模型。但是,关于自顶向下注意引导的研究却遇到了一些困难。目前,大多数模拟自顶向下视觉注意机制的感知模型都是在原有的自底向上注意感知模型的基础上经过改进得来的。出发点是基于自底向上注意的数据信息,有一定的局限性。因此,研究自顶向下的注意感知理论并建立相应的模型已成为当前视觉感知系统信息处理理论中的一个亟待解决的问题。研究视觉感知系统信息处理理论的一个主要内容涉及目标对象和空间位置感知,其实质就是研究两个视觉子系统what通路和where通路的功能。因此,本文以视觉通路理论为指导,构建自顶向下的视觉注意感知模型,探索视觉感知的新理论。在正常的人类视觉中,自底向上和自顶向下处理过程的结合将会影响我们的注意,并将注意吸引到显著的相关场景部分。所以,我们强调的模拟自顶向下的注意感知,实际上是一个自下而上和自上而下的有机融合和相互作用的过程。本文将与where通路相关的空间位置感知分成两个层次的概念:目标所处的空间环境和目标所在视觉空间中的具体位置。用目标所处空间的大范围信息——环境信息作为where通路中传输的一级where信息,用目标在视觉空间中的具体位置作为二级where信息。将what通路中传输的目标感知信息作为what信息。与注意机制相结合,一级where信息可以用来驱动自顶向下的注意,处理大范围环境空间信息,为目标感知提供指导。二级where信息与what信息一起可以用于驱动自底向上的注意,形成感受和进行对象识别。本文主要创新点有:第一,提出了一种新的自底向上的注意信息提取算法(Integration of localcomplexity and early visual features,LOCEV)。LOCEV算法综合考虑了三方面特性来定义显著性:1.根据特征空间中的不可预测性来衡量特征的复杂度;2.在尺度空间中衡量特征的统计不相似特性;3.同时考虑特征空间和尺度空间,衡量特征的一些初级视觉特性。得到的显著区域在特征空间和尺度空间中同时显著。图像中所有的点在对应尺度下的区域显著值构成了整幅图像的what信息,其中的位置信息和尺度信息就构成了对应的二级where信息。获取的自底向上的注意信息具有旋转、平移、比例缩放不变性和一定的抗噪能力。第二,提出了一种新的以环境为中心的一级where信息提取算法(Context-centered first level where information extraction,CONCEN)。CONCEN算法分为三个阶段:1.提取一级where信息的高维编码;2.对一级where信息高维编码进行子采样处理;3.计算高维编码子采样输出的统计特征。将最终的统计特征系数定义为一级where信息,结合注意机制,一级where信息可以用来驱动自顶向下的注意,处理大范围环境空间信息。CONCEN算法定义的一级where信息不是以目标为中心的局部信息的简单叠加,而是将整个场景看成一个独立目标得出的真正意义上的环境信息,既保留了原始场景环境的全局结构信息,又反映了空间、频率和朝向特性。根据一级where信息获得相关目标的先验知识,用于指导与wha信息和二级where信息相关的自底向上的注意。第三,提出了一种新的基于what和where信息的视觉感知模型(Wha andwhere information based visual perception model,WHAT-WHERE)。WHAT-WHERE模型采用以环境为中心的一级where信息进行自顶向下的注意控制,指导what信息和二级where驱动的自底向上的注意。自顶向下的注意包括预注意和集中注意两个阶段,预注意依据一级where信息为特定目标出现与否提供先验,做出是否继续搜索的判定。集中注意的结果与what信息和二级where信息相结合,将注意指向目标最有可能出现的图像区域,即集中注意区域,并得到了图像集中注意区域中的当前显著目标区域和显著目标区域转移的潜在目标。在显著目标区域转移的过程中,提出了一个新的目标转移准则——吸引力。根据各潜在目标区域对当前显著目标区域吸引力的大小,确定下一个待注视的显著目标区域和相应的潜在目标。以此循环,并得到一系列显著目标区域。一级where信息既可以为哪种目标最有可能出现提供很强的先验,也可以为图像中期望的目标出现的位置提供先验,从而可靠地指导自底向上的注意。WHAT-WHERE模型在预注意完成后根据条件就可以停止整个检测过程,从而在很大程度上节约计算资源。将集中注意的结果与what信息和二级where信息相结合,为将注意集中到与目标相关的显著区域提供了有效机制。
其他文献
第一部分动态监测重症肺炎患者血液和支气管肺泡灌洗液中IL-6、IL-8、IL-10的含量及其意义目的观察重症肺炎患者血液和支气管肺泡灌洗液中白细胞介素-6(IL-6)、白细胞介素-8(
假设波动率为常数的B-S模型是不符合金融市场实际的,并且期权市场数据中隐含波动率有关执行价格曲线的“微笑”和“偏斜”效应进一步证实了波动率是随机的,于是,本文基于B-S
本文对故障恢复系统中涉及到的多方面问题做了研究。用双层树结构模型描述配电网拓扑结构,提出了适合此结构模型的全局结线分析和动态局部分析。根据配电网的特点,提出一种分
本文主要是对公司利润分配的法律规制展开研究,兼谈利益冲突的平衡。本文从公司利润分配的功能及其规范的特点入手,着重介绍了我国《公司法》关于公司利润分配的一般规范,进
目的通过对患者临床症状及心肌酶变化的分析,客观评价甲亢及心肌损害的临床意义。方法对37例甲亢伴心律失常患者及35例健康者的乳酸脱氢酶、羟丁酸脱氢酶(HBDH)、肌酸激酶、肌酸
随着“数字地球”、“数字中国”、“数字城市”等概念的提出和现代空间信息技术的飞速发展,城市岩土工程的三维建模与可视化已成为当前地学研究的前沿课题。开展城市三维岩
文章先阐述了波兰尼的默会知识论,表明“默会”一词蕴涵着“非言述”与“难以言传”两层含义。在对默会知识的难言性进行简单地分析之后,介绍了知识表征的内容与形式,并尝试
本文研究中国上市公司股权结构与多元化投资的关系,及多元化投资与公司价值的关系。通过对2004年至2006年深沪两市A股上市公司样本筛选、加工,采用多元回归分析实证研究的方
本研究采用PISA2015数据,分析我国中学生课外补习的时间、选择的课外补习的方式、经过不同补习方式的学生在学习成绩方面是否有显著的差异、参加课外补习的原因等。本文取家
近年来,中国造船业处于快速成长阶段,但设计能力落后、配套产业发展滞后、大量电子设备和核心装备依赖进口,一直是制约行业发展的主要瓶颈。主机遥控系统是船舶自动化系统的