基于全局优化和局部增强的显著性检测算法

来源 :山西大学 | 被引量 : 0次 | 上传用户:suease
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从图像中提取有价值的信息是尤为重要的,它为视觉信息处理提供了必要的前提和技术基础。而显著性检测则是提取有用信息的有效手段之一,它通过模拟人类注意机制,可以检测出人的视觉系统优先关注到的区域,为后续复杂的图像处理任务降低了处理难度。因此,研究视觉显著性检测极具研究意义和应用价值。基于深度学习的显著性检测算法能够获得相较于传统方法更精细的检测结果。然而,目前的检测效果不能获得准确的显著目标定位,同时所获得的检测结果往往丢失一些细节信息。因此,本文将开展两个方面的研究工作:(1)研究解决现有方法对复杂场景中显著目标尺度变化大、定位不准确的问题。本文提出了基于多级全局信息传递模型的显著性检测算法。该算法在较高层级引入了多尺度全局特征聚合模块,并将多层级提取出的全局信息进行融合;然后将融合后的高级全局语义信息以特征传递的方式和较低层次特征融合。这些操作可以最大限度的提取到多尺度上下文信息来增强全局特征,同时避免这些信息在逐步传递到低层时产生损失。充分利用全局上下文信息能够使得复杂多变的显著目标的定位更准确,同时在一定程度也减少无关背景干扰。在四个基准数据集上与其他方法进行对比,结果表明该算法在准确率、召回率、F-measure值及MAE等指标上优于几种经典的图像显著性检测方法。(2)研究解决现有算法所获得的显著目标检测区域不完整、边界模糊等问题。为此,本文提出了基于像素级特征信息增强模型的显著性检测算法。该算法采用分层处理的思想集成不同层次的特征信息,首先通过引入像素级注意力模块和渐进式边界细化结构,强化空间局部细节和目标边界轮廓;其次利用特征金字塔注意力模块提取出更有显著性判别力的全局信息。这些操作优化全局指导信息的同时,还充分增强了局部细节特征,一定程度上解决了空间局部细节的二义性问题,并使得目标边界部分更加清晰。实验结果表明,该算法在复杂场景中依然可以突出目标,实现较精确的显著目标定位,相较于传统以及深度显著性检测算法,在ECSSD、PASCAL-S等4个数据集上均表现出较好的性能。综上所述,本文分别从优化全局和局部增强角度出发,构建了多级全局信息传递模型和像素级特征信息增强模型用于显著性检测。通过定性、定量实验对比,本文方法表现出较优的检测性能,其F-measure值在ECSSD、DUT-OMRON数据集上分别最高达到了0.935、0.814。这为显著性检测在细节信息的保留和增强提取全局上下文信息的能力方面提供了新的研究思路。
其他文献
当下,人们生活中的衣食住行都向着智能的方向改进,而这一切都离不开对数据信息的挖掘。智能的生活方式产生了海量数据,数据挖掘就是从大量数据中发现其中潜在信息的过程。在数据挖掘领域中,高维数据导致的维度灾难和数据过拟合是困扰研究人员的两大问题。特征选择是一个重要的数据预处理步骤,通过从候选特征集中挑选出重要的特征组成新特征子集,利用该子集进行模型训练等学习任务。进行特征选择可以有效地克服维度灾难问题,缓
目前,越来越多的计算机视觉系统被广泛应用于各个行业,这些计算机视觉系统大都以输入清晰图像为前提进行工作,但是在实际场景中,特别是在室外环境下,由于雾、霆等天气原因,我们无法保证获取到清晰可用的图像数据,因此图像增强技术越来越受到研究人员的关注。应用水下机器人进行水下探测是一项重要任务,而计算机视觉技术是完成这项任务的关键环节。但是光的吸收和散射现象同样存在于水下环境中,比起有雾图像,水下图像会遭受
随着5G、互联网、云计算以及其他技术的迅速发展,网络环境日益复杂,且攻击形式日益多样化,也为网络空间安全带来了严峻的考验。网络入侵检测技术采用一种主动防御方式来维护网络的安全,为网络提供实时的监控与动态的保护。面对海量的网络数据,现有的入侵检测模型不仅无法有效处理这些高维且复杂的数据,也难以识别数据样本较少的攻击类型,且模型检测效率低、识别率较差。基于上述问题,本文提出了基于PGoogLeNet-
近年来,随着物联网迅速发展,射频识别技术(RFID,Radio Frequency Identification)被广泛应用于物流追踪、身份识别与国防军事等多个领域。目前,由于有芯片RFID传感器标签制作成本较高,所以设计低成本的无芯片RFID(Chipless RFID)传感器标签成为现今研究热点。本文针对无芯片RFID传感器标签的抗杂波性能进行研究与设计,具体从传感器标签的结构设计、极化转换特
网络资产是指连接到互联网的网络设备、安全设备、中间件、服务器、个人计算机等设备的类型和版本、操作系统类型、IP地址、开放端口及端口服务等信息。对网络资产进行探测和管理既可以帮助企业网络资产管理人员清楚地了解企业内部拥有的网络资产,又可以作为渗透测试人员或黑客开始工作前的信息收集,因此,对各种网络资产信息进行有效探测是必不可少的。其中,操作系统是各种设备运行的基础,当前市面上的操作系统类型众多,而现
近年来随着信息技术的快速发展和数据获取方式的不断丰富,人们对于图像视频类数据的处理需求也越来越多,目标跟踪作为图像视频类数据处理的重要技术,与之相关的研究也变得异常火热。从基于传统计算机视觉技术的相关滤波算法到基于深度学习跟踪模型的出现,跟踪算法的性能得到大幅提升。但是,在目标跟踪领域始终面临着多方面的挑战,如:复杂的背景、光照变化、目标物被遮挡以及运动物体的旋转尺度变化等,严重影响现有目标跟踪算
在互联网信息技术普及的21世纪,流行媒介作为现代化生活直接有效的信息传播方式,形成以数字媒介为主体的发展趋势。它丰富的图像语言以及广泛的视觉传播性得到了大众的认可。抽象立体形态的图像语言借助媒介反映了人们追求时尚理念与情感表达的诉求。笔者尝试和运用抽象立体形态语言进行创作,展现客观物体的三维形态,本研究以基础理论作为支撑,在C4D软件技术背景的支持下,将传统文化形象最终以抽象立体的形态语言呈现出来
近年来,随着自然语言处理技术的快速发展,聚焦于词级、短语级的研究已取得显著进展,针对于句子级的语义分析任务还相对较少,因此侧重于理解句子语义的篇章句间关系识别任务得到了研究者们的广泛关注。该任务作为篇章语义分析中的一项核心任务,旨在研究篇章内部论述单元(简称为“论元”)的逻辑语义关系,如因果关系、比较关系等。如何更准确的挖掘论元的深层语义信息是研究该任务的关键,也是影响模型性能的主要因素。本文主要
在当今数据爆炸的时代,数据降维是机器学习、模式识别以及数据挖掘等领域的共性问题之一。伴随着数据采集相关技术的快速发展应运而生的是大规模的高维数据的出现,普遍存在于数据处理应用过程中。当今数据采集技术的发展水平的仍有局限,数据源种类众多,数据类型也发展的更为多元化,采集阶段会将部分低质量数据比如噪声数据纳入采集结果中。虽然高维数据具有更全面的特征信息,可以更好的去刻画数据内部结构,但是无疑会带来负面