基于整体与局部感知的显著性物体检测

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:shwjdbr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从自然场景中高效提取感兴趣的重要信息是计算机视觉必须解决的问题,人类视觉系统是借助视觉注意机制来处理这一问题,其中涉及特征整合、视觉搜索与注意力转移、时空信息整合、局部→整体/整体→局部的整合等人眼感知机理。人眼不仅能实现高效环境整体感知,同时又具备观测局部精细特征的能力。人脑中的整体与局部信息的整合机制尚不清楚,是有待深入探索的问题。为了借鉴人眼的这种感知能力,本文从整体与局部感知及其整合的角度探讨了图像中显著性物体的检测问题。(1)基于多级特征融合的整体感知显著性物体检测。为了融合底层细节特征和高层语义特征来针对显著性物体检测的互补性,采用编码-解码卷积网络作为骨干结构,提出了多级特征融合的整体感知模型。编码器通过逐层卷积将图片中由局部细节到整体粗略的特征提取出来,进而由解码器采取整合操作处理特征,捕捉到显著性物体在图像中存在的可能性。整体融合感知图是通过叠加操作进行融合,实现整体感知显著性物体检测。在公开的数据中的测试结果表明,多级特征的融合提升了显著性物体的检测准确率,同时该模型也优于其它经典的显著性物体检测模型。该模型同样可以用于焦点预测,测试表明,其性能在SIM、EMD指标上优于经典的视觉焦点预测模型。(2)整体到局部视觉搜索引导的显著性物体检测。为了模仿人眼对物体的关注机制,本文提出基于视觉搜索引导的整合整体和局部感知的显著性物体检测模型。在多级特征融合的得到的整体感知图基础上,为了提高整体与局部感知的整合能力,通过MSER算法,截取前期整体感知图中的局部热点子区域,基于最大响应度的原则生成视觉引导搜索路径,并通过SENet网络逐次融合局部精细感知图,最终得到整合整体和局部感知的显著性物体检测结果。该模型实现了类似人眼观测过程中由粗到细、迭代观测的行为,在显著性物体检测实验中表现出优异的性能。实验测试结果说明在F测度上本文模型优于其它模型,在S指标和MAE指标上也优于或逼近其它经典模型的结果。(3)改善局部边界精细感知能力的显著性物体检测。为了进一步改善显著性物体检测的边界清晰度,引入交叉熵函数、结构相似性函数、交叠率损失函数组合成混合损失函数,从像素-区块-特征图三个层级进行深度监督学习,使得检测得到的显著性物体边界更贴近于真实显著性目标。在六个显著性物体检测数据集的检测结果中,MAE指标都获得了较大提升,说明结构相似性损失函数与交叠率损失函数对于模型的局部边界处理有良好的指导作用,优化了物体边缘检测结果。本文从整体与局部感知及其整合的角度,研究了基于多级特征融合的整体感知显著性物体检测。在引入视觉搜索机制的基础上,提出了基于整体与局部视觉搜索引导的显著性物体检测。在对边界作局部精细感知的前提下,改进了显著性物体检测模型对局部边界精细感知的能力。上述研究是对类人注意机制建模的一种探索式的工作,对该领域相关研究具有较大的借鉴价值。
其他文献
随着信息技术的快速发展,社会生产中产生的数据呈爆炸式增长,如何从这些海量的数据中智能高效地进行知识发现已经成为人工智能领域中的研究热点。如何处理不确定信息并从中挖掘出有价值的知识,是知识发现中面临的一个关键问题。粗糙集理论作为处理不确定性问题的一种有效的数学工具,由于在处理不确定性问题时无需提供除数据本身以外的任何先验知识,近年来已经成为了处理不确定信息的重要方法。粗糙集模型的上、下近似集在描述不
随着经济的快速发展,网络正在我们生活中扮演着重要的角色,与我们的生活息息相关,给我们的生活带来了极大的便利。但与此同时,网络规模的不断增大,网络所面临的威胁也逐年增
选择性激光熔化(Selective Laser Melting,SLM)是近年迅速发展起来的一种增材制造技术,它能够直接成形具有复杂结构且致密度超过99%的金属工件,具有广泛的应用前景。在SLM加
大部分数鱼类是变温动物,寒冷压力对于鱼类的生长以及生殖等重要过程都具有重大的影响,鱼类冷适应机制一直以来都是研究的热点。环境温度变化具有即时性的特点,传统遗传学无法很好地解释短时间内产生的冷适应性状,这就需要通过表观遗传学进行分析研究。鱼类作为真核生物,其细胞核内的染色质高级结构具有复杂且高度动态化的特点。根据环境压力变化,在较短的时间内调控基因的表达,产生有利的性状,能够帮助生物快速适应环境,获
基于稀疏SLAM(Simultaneous Localization And Mapping)框架的三维信息估计技术,在三维重建,路径规划、增强/虚拟现实等领域都具有重要的研究意义与应用价值。然而,目前系统
本文通过在火花塞顶置式定容燃烧弹中添加扰流装置,实现了加速氢-空预混火焰燃烧进程,同时研究了扰流装置的结构参数和初始条件对氢气-空气预混燃烧特性的影响规律。首先,分
随着“工业4.0”、“互联网+”和“大数据”的迅速发展,网络信息呈爆炸式增长,如何从浩如烟海的互联网数据中抽取有价值的信息是当前研究的热点。信息抽取的主要目的是从海量
在智能化时代,计算机视觉技术解决了机器“看”世界的问题,作为计算机与世界沟通的桥梁,目标跟踪技术是搭建该桥梁的核心技术之一。当前,目标跟踪技术在视觉导航系统、智能视
本文研究了美国篮球联盟(NBA)中代理理论的动态性,并发现团队经理将报酬作为工具来减轻其代理成本。我使用两种不同的方法来衡量绩效,即传统的和分析的,并发现两者与团队收益
区别于传统单标签学习问题,多标签学习中每个样本可同时与多个标签相关联。在多标签分类过程中,合理使用标签空间相关性可显著提升多标签分类精度。其中链式多标签算法作为一