视觉搜索中的眼动分析与建模

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:WYH5198
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在感知真实世界时,人眼通过在视野内场景的各个区域问跳转以移动注意焦点、获取图像中的信息。视觉搜索是人最常发生的视觉行为之一,相较于一般的自由观看任务,视觉搜索中的眼动行为与搜索场景间的联系更为紧密。因此对眼动行为的分析和建模可以使研究者们更加透彻了解人的选择注意过程。此外,视觉搜索中的眼动分析和建模对一些实际应用如物体检测、压缩编码、公共设施设计、广告设计、病理诊断等也有着借鉴价值。   本文针对视觉搜索中的眼动分析和建模展开了研究,对视觉搜索中的眼动进行建模并在此之上比较了在视觉搜索中影响眼动的因素。   第一,根据视觉搜索的心理学和神经科学理论基础,本文对视觉搜索的眼动进行建模。模型包含了四个主要模块:自顶向下的目标引导、自底向上的显著性、眼动固有习惯以及视点跳转过程等。模型主要关注于视点序列的生成过程。   第二,本文比较了自顶向下目标引导、自底向上显著性以及眼动固有习惯在视点路径中的重要性。针对一些研究者提出的“视觉搜索由目标引导”的观点,本文尝试了多个自底向上显著性计算方法。在本文的研究中发现,自底向上显著性在视觉搜索有着重要的作用。在场景中包含目标时,自顶向下目标引导影响力最大,在场景中不含目标时,眼动固有习惯的影响力较为突出。将三个因素融合在一起的模型能够最好预测视点序列。   第三,基于对视点三成因的分析结果,本文利用融合了全部因素最优组合的模型模拟了人在观看图像时的视点路径。将人工视点路径与真实视点路径比较后发现,模型可以有效的模拟视觉搜索中人的眼动行为。
其他文献
当今时代网络技术的迅猛发展和对海量数据处理能力的迫切需求促进了云计算的发展。作为一种新型的计算模式,云计算具有很多传统计算模式所不具备的优点,因此受到工业界和学术界
随着互联网技术的迅猛发展,计算机通信给人类文明带来了翻天覆地的变化。很多情况下,人们的日常工作需要借助网络来完成。应用网络进行各类数据信息的交互不仅得到了广大服务提
目前,我国各油田均已进入开发后期阶段,随着石油勘探和开发工作的深入,油田积累的勘探开发信息日益丰富。由于储层的非均质性强,某些油田有些开发井井距已经达到不足百米,众多的勘
以蚁群算法为代表的群智能方法在遥感信息提取方面的研究是一个新的方法。本文在总结当前分类方法的基础上,将蚁群算法分为基于觅食行为的蚁群优化算法和基于堆尸行为的蚁群
移动网络用户的信息存储是在移动环境下对用户进行快速定位的关键。在移动环境下,对于一次通信过程,系统需要查找并定位相应的接受方的信息,而这个过程往往是要求低延迟和快
命名实体识别作为序列标注任务之一,与分词、词性标注等都是中文自然语言处理的基本任务。多个自然语言处理的应用,如信息抽取、信息检索、机器翻译和问答系统等都依赖命名实体
现代石油产业中,石油储量的预测是制定能源规划的重要组成部分。通过石油储量预测,可以制定最优的石油战略、安排石油建设以及优化配置等等。预测结果的合理性主要取决于预测方
随着计算机软硬件技术的发展使得计算机的应用领域越来越广泛,许多公司都建立了自己的内部网络用来提高办公效率,降低运营成本,这就使得通过网络传输的数据不断增加,网络在为企业
负选择算法是人工免疫的分支,对自我和非我细胞区分过程进行计算模拟,主要是模拟胸腺中T细胞的成熟过程。由于计算机安全领域的核心问题是识别异常状态,这与生物免疫系统所遇
随着分布式计算环境中,网络上的节点向着智能化和服务性方向发展,主体(Agent)和多主体系统(Multi-AgentSystem,MAS)成为支持开放的、可重构和可伸缩的新型分布式协同计算的重要