论文部分内容阅读
在感知真实世界时,人眼通过在视野内场景的各个区域问跳转以移动注意焦点、获取图像中的信息。视觉搜索是人最常发生的视觉行为之一,相较于一般的自由观看任务,视觉搜索中的眼动行为与搜索场景间的联系更为紧密。因此对眼动行为的分析和建模可以使研究者们更加透彻了解人的选择注意过程。此外,视觉搜索中的眼动分析和建模对一些实际应用如物体检测、压缩编码、公共设施设计、广告设计、病理诊断等也有着借鉴价值。
本文针对视觉搜索中的眼动分析和建模展开了研究,对视觉搜索中的眼动进行建模并在此之上比较了在视觉搜索中影响眼动的因素。
第一,根据视觉搜索的心理学和神经科学理论基础,本文对视觉搜索的眼动进行建模。模型包含了四个主要模块:自顶向下的目标引导、自底向上的显著性、眼动固有习惯以及视点跳转过程等。模型主要关注于视点序列的生成过程。
第二,本文比较了自顶向下目标引导、自底向上显著性以及眼动固有习惯在视点路径中的重要性。针对一些研究者提出的“视觉搜索由目标引导”的观点,本文尝试了多个自底向上显著性计算方法。在本文的研究中发现,自底向上显著性在视觉搜索有着重要的作用。在场景中包含目标时,自顶向下目标引导影响力最大,在场景中不含目标时,眼动固有习惯的影响力较为突出。将三个因素融合在一起的模型能够最好预测视点序列。
第三,基于对视点三成因的分析结果,本文利用融合了全部因素最优组合的模型模拟了人在观看图像时的视点路径。将人工视点路径与真实视点路径比较后发现,模型可以有效的模拟视觉搜索中人的眼动行为。