基于注意力机制的图像显著区域提取算法分析与比较

来源 :北京交通大学 | 被引量 : 33次 | 上传用户:jwc4542
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于生物感知的图像显著特征分析在二十世纪九十年代末兴起,并逐渐成为生物视觉感知领域研究的焦点。该方法结合人类心理学和生理学理论知识,基于人类视觉注意机制,模拟人眼机能建立图像显著性提取模型。视觉显著性特征提取作为一项独立的技术,可以帮助我们更好地分析和理解数字图像。提取图像显著性的研究是一个图像分析,特征提取和探索人类视觉特性的综合过程,对各种基于图像分析和理解的应用都有着非常重要的意义。本文的工作是分析各种显著图生成模型,实现基于注意力机制的显著图生成算法,开发算法实现与比较系统,并进行结果分析。本文分析五种显著图生成算法。Itti模型是典型的基于空间的注意模型,它对一幅输入的图像提取颜色、亮度、方向等特征,然后在各个特征维上形成关注图,最终融合这些关注图为显著图;SMG(Saliency map generation)算法是一种“尺度内中心周边对比,尺度间插值融合”的基于特征的注意模型;HC(Histogram-based Contrast)算法是基于直方图对比的显著图生成算法;RC(Region-based Contrast)算法是基于区域对比的显著图生成算法,该算法使用分割算法将图像分割成区域,在区域级上进行基于颜色直方图的显著值计算;FT(Frequency-tuned)算法是基于频率调频的显著图生成算法,并且增加了边缘检测。基于以上的研究工作,本人对基于注意力机制的显著性特征提取理论进行了梳理,重新实现Itti算法和SMG算法。然后根据算法提取显著区域的准确率,对各算法进行比较评测,参照的标准是微软亚洲研究院(MSRA)提供的显著对象图像库。比较发现,RC算法的准确率最高,但该算法的存贮量和计算量较大:SMG算法效率高,系统开销小,有助于满足图像检索的实时性要求;Itti算法需要对原图像降采样,显著图仅为原图像的1/256;FT算法计算效率高,而且输出的显著图是全分辨率的;LC算法避免了图像分割,因此对于那些难于自动分割的图像,效果非常好。
其他文献
音乐具有情感,有的情感比较单一,有的情感可能比较丰富;由于主观因素的存在,每个听众对每首音乐具有的情感的标定也是不一的,这就对情感定义和情感库的建立带来难度。本文以音乐情
电力调度自动化系统作为电力系统运行调度与控制的大脑,用于实现对电力系统在线计算机控制与调度决策,其在电力系统中的作用日益显著。目前,我国正在大力进行智能电网建设,智能调度是智能电网发展的必然趋势,而智能调度的基础是电网调度自动化系统。因此,必须加强身份认证技术和访问控制机制,来保障电力调度自动化系统的安全。在身份认证方面,本文针对调度自动化系统存在身份冒充的问题,提出了一种新的双因子的双向身份认证
将互联网上海量的非结构化文本数据转为应用所需的结构化知识,使其可被计算机高效地利用是改进搜索系统,实现智能问答与机器阅读的基础。在这个过程中,实体链接技术扮演了一
近年来,学术界针对数据发布中的隐私保护问题已经提出了许多模型和算法,这些模型和算法在不同程度上解决了数据发布中的隐私泄露问题。但是,现有的模型和算法主要是针对分类
目前在计算机视觉和模式识别领域内,非负矩阵分解(NMF)越来越多得被用作特征提取。NMF寻找两个小的非负矩阵,使得它们的乘积能够最好的拟合原始矩阵。而非负的这个限制导致了
无线传感器网络是由在监测区域内部署的大量多功能、低能耗、廉价的微型传感器节点组成的智能专用网络。由于具有部署灵活、扩展方便、价格低廉等优点,无线传感器网络在工业、
数字水印技术在图像、视频和文本等多媒体载体上的应用已经成熟,但在嵌入式系统、集成电路设计等领域的知识产权保护仍处于探索阶段。考虑到设计和开发一个新的FPGA芯核电路需
网络的日益普及和人们对技术的日益依赖,使得数据越来越多的以电子的形式存储在计算机中。在当今高节奏社会,无论是在大型的企业数据中,还是在网络上,如何迅速有效的找到所需
面向服务的体系架构(Service Oriented Architecture,SOA)的提出,使软件开发从传统的面向对象方式向面向服务方式转变。作为可以在组织内部的异构计算资源中被共享、组合和复
电子商务中产生越来越多的产品和交易信息,使得用户快速找到自己想要的产品变得越来越困难。同时,电子商务企业也面临着如何推荐让用户满意的产品从而提高销售量的问题。电子