基于视觉注意力机制的图像检索方法研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:lrg123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,基于内容的图像检索系统(CBIR)是一个热门的研究话题。传统的图像检索系统通常根据图像的底层特征(颜色、纹理和形状等)建立索引进行检索,但这种基于全局的方法在图像的内容的表达上具有一定的局限性,它忽略了图像中不同的区域吸引人眼注意的程度不相同这一事实。后来提出的基于区域的检索方式中,大多数方法依赖于图像分割实现区域的划分,而目前精准图像分割技术仍是难以解决的问题之一,因此导致检索结果不甚理想。相关研究表明,人眼在观察物体时,总是会把注意力集中到图像中感兴趣的部分,因此针对感兴趣区域进行检索是一种较为有效表达用户意图的检索方式。本文在分析了总结了基于内容的图像检索的发展状况及趋势的基础上,根据近年来人眼心理学中的注意力选择机制,融合Itti-Koch和Stentiford注意力模型,提出一种新的基于图像显著区域(用户感兴趣区域)的检索方法。首先,改善了现有注意力机制模型,使提取的显著区域更加符合人眼观察结果;其次,对获得的感兴趣区域,利用局部结合整体的方式,既考虑区域中所具有的稳定特征,同时充分利用区域的空间布局关系反映图像的整体构成,并结合二者进行检索,克服了传统检索中不能解决的图像旋转、平移、亮度变化等缺点,也充分体现了人眼对事物的认知过程。文中提出的方法可以自动提取图像的感兴趣区域,从而摒弃了采用手工标识的方式选择显著区域,使区域的匹配目标更为明确;另外,以显著区域为线索进行检索,有利于去除背景信息的干扰,使检索直接贴近用户意图。实验表明该方法与传统的基于全局特征进行检索的方式相比,具有更好的检索性能。
其他文献
随着云存储技术的快速发展,使用云存储保存或者备份数据的企业或者个人也越来越多,用户在使用云存储服务时更加注重数据的安全性,而数据安全保护技术主要是通过对数据进行加
信任评价模型可以解决网络中的一些安全问题,但是当网络中的节点数目非常大时,现有全局信任模型的计算量与通信开销比较大,影响了信任模型的推广和应用。针对该问题,本文在参
近几年来基于P2P技术的网络应用迅速发展起来。有关的研究人员认为,P2P技术的应用将使网络上的资源得到充分利用和最大化的共享。P2P技术在内容分发、实时通信、协同工作、以
粗糙集理论作为粒度计算的三大模型之一,自产生起就备受关注,并已广泛应用与机器学习、模式识别等领域。其主要内容包括近似集、决策系统、数据预处理以及属性约简等等,是一
随着数字电视广播技术的发展,数字电视接收系统的研究与开发已成为新的发展方向。龙芯处理器以其低成本、低功耗、指令级并行等优点广泛应用于嵌入式领域。本文基于龙芯2E处
随着网络的普及和应用,越来越多的软件系统部署在Internet上,由于网络平台与传统计算机软件平台特征上有很大的不同,促使软件系统的运行环境从静态、封闭逐步转向动态、开放
时间序列分类是时间序列数据挖掘的重要任务之一。它比普通分类问题困难的主要原因是时间序列数据长度不一致,而一般的分类算法只能处理长度相等的数据。即使是长度相等的时间
随着现代信息技术的不断发展,学校的各项业务也逐渐智能化、信息化。其中,最为显著的就是校园一卡通的应用。本文以山西师范大学校园卡关于学生就餐交易数据为研究对象,通过
随着技术的发展与科学的进步,数据量的飞速增长已成为一个不容忽视的问题,面临堆积如山的数据,想要获取有用的信息与知识并非易事。因此数据挖掘技术伴随着人们的需求与科技
企业信息门户是企业信息集成一种可行的解决方案。为了达到企业信息集成的目的,企业信息门户通过Portlet组件之间进行数据交互通信协作来实现。不过目前Portlet规范并没有明