论文部分内容阅读
视觉注意是人类信息加工中一项重要的心理调节机制,是人类从外界输入的大量信息中选择和保持有用信息,拒绝无用信息的意识活动,是人类视感知过程中高效性和可靠性的保障。视觉注意计算模型的研究,不但有助于探索人类视觉信息处理的工作机理,而且对于解决数据筛选问题和提高计算机的信息处理效率有着重要的意义,在图像分析与图像理解领域、目标检测、信息检索、机器人视觉、视频通讯等领域也有重要的应用价值。本文对视觉注意机制及其计算方法进行了深入而细致的研究:分析总结了视觉注意机制的认知神经学理论和神经加工机制;以人类视觉加工的生理学理论为依据,紧密结合计算机视觉计算的要求,构建了一个由特征加工、注意集中和注意控制三部分组成的动态视觉注意计算模型的体系结构。提出了一种双通路和层次化的特征加工结构;提出了一种深度特征和运动特征度量方法,以反映场景时空特性对视觉注意的影响;通过IFNN神经网络模拟双通路的特征整合过程,实现注意的集中;提出了一种具有注意保持和唤醒功能的注意控制方式。在此基础上,实现了一个基于客体选择的动态视觉注意计算模型。实验表明:本文所提出的计算方法是富有成效的。本文首先总结了视觉注意机制的认知神经科学及心理学理论,从生物视觉领域找出计算机视觉可借鉴的神经生理学依据,并以之为出发点,寻找认知心理学中注意机制与计算机科学的结合点,构建一个动态视觉注意计算模型的体系结构,并将视觉注意计算划分为特征加工、注意集中和注意控制三个模块,实现认知神经科学与视觉计算的结合。在特征加工的过程中,解决了特征的选择,特征的显著性度量和特征加工的层次三个方面的问题。在特征选择方面,将特征分为空间特征与非空间特征两类,空间特征的提取是通过提出一种深度特征与运动特征的计算方法来实现的,用以反映场景的时空特性对视觉注意的影响;非空间特征通过提取亮度、颜色和方向特征得到。各类特征的显著性度量依据视觉反差计算实现。根据生物视觉中特征加工层次和功能的差异,空间特征与非空间特征通过模拟what和where双通路理论进行加工,各类特征的显著图由子特征之间相互竞争和整合得到。在注意集中方面,以视觉通路理论为指导,通过使用亮度特征、颜色特征和方向特征等非空间特征来描述物体的感受,模拟what通路的主要功能;运动特征和深度特征等空间特征用来描述场景的运动和空间信息,模拟where通路的功能。两个通路的整合通过带有自学习和可调节机制的IFNN神经网络实现。根据神经网络的脉冲发放时间进行注意焦点的选择,当两个通路的输入相关联的时候,神经网络产生最大的增益,输出单元的脉冲发放时间会比非相关单元的发放时间更短。在注意控制方面,根据视觉注意的神经控制特点,提出了一种动态视觉注意模型的注意控制方式。通过一个唤醒信号来描述视野中新异刺激的强度,根据唤醒信号的大小开启或屏蔽阈值来控制注意保持与注意唤醒状态的转换。采用注意焦点跟踪算法来实现动态场景的注意保持;并提出了一种位置增强方法,以提高新异刺激所在位置的视觉显著性。本文的研究比较完整地给出了视觉注意计算的思想与方法,实现了一个适用性较强的动态视觉注意计算模型,并提高了该计算模型的理论价值和应用价值。实验表明,本文提出的模型较好地运用了视觉认知规律,使视觉注意处理结果更加符合人类视觉感知的基本特征。