基于多种深度特征的图像显著性目标检测

来源 :山东大学 | 被引量 : 0次 | 上传用户:luo_yanjiang1980
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代的到来伴随着数据体量的指数级增长。作为记录和表达信息最直观、最方便的方式,图像的处理方法一直是研究者们的热门课题。如何模仿人类的视觉注意机制,检测图像中的显著目标,是当前计算机视觉研究的重点之一。近年来,基于深度学习方法的不断被提出。卷积神经网络的出现,极大地改善了现有的显著性检测方法。本文致力于充分挖掘图像中不同方面的深度信息,通过多种特征的获取,使模型能达到较高的准确度。本文对于图像显著性目标检测任务中用到的传统方法和常用的深度学习检测方法中出现的主要缺陷进行了列举分析,并提出了相应的解决方法。本论文的主要贡献如下:对于待测图像中可能出现的多个显著目标以及显著区域不易确定的问题,本文提出了多层级连续深度特征聚合的网络结构。该方法改进了传统深度网络的结构单向性、利用特征单一性的劣势,采用多层中间特征图参与最终显著性特征图的融合。网络结构上分为三个部分,多层卷积编码阶段获得不同层级尺度的特征图,上采样解码阶段将各个层级的特征图上采样至合适尺寸,最后在融合阶段对这些上采样后的特征图进行融合。该方法借鉴了传统方法中多尺度融合的思想,在深度学习的任务中也取得了不错的表现。实验结果表明,该方法在定位显著区域上有着优越的表现。在此基础上,本文又对图像的其他深度信息进行显式建模。对于待测图像低对比度的问题,本文提出了一种基于通道注意力机制的多通道特征重加权模块和多通道特征融合模块。由于显著性目标检测任务本质上是对人类注意力机制的一种模仿,这类模块结构能充分挖掘待测图像的深度通道特征信息,找出对显著性刺激贡献较大的通道并对其进行重新加权,突出其在特征图中的地位。首先,图像在卷积阶段经过全局池化层进行通道粗编码,然后该向量经过自适应重加权部分重新学习特征通道的显著性刺激贡献,最后返回权重向量与原图像对应特征图进行相乘累加形成新的特征图。实验证明,在多个具有挑战性的公共数据集上,该方法能够明显的提高检测模型的表现。对于待测图像中显著目标轮廓模糊的问题,本文提出了显著性目标轮廓辅助检测任务,通过引入支路的方式,对图像中待测目标的轮廓信息进行显式地建模。该任务的支路网络结构与主路结构类似,但由于检测目标变为了显著目标的轮廓,在网络层级的数目上较主路结构有些许减少。该支路的引入,使得最终的检测网络变为由主体检测为主,轮廓检测为辅的多任务神经网络结构。实验表明,这种辅助多任务检测网络能够明显细化目标的边界信息,使目标轮廓更加清晰,在定量指标上也有着明显的改善。最后本文将上述三种深度特征信息的建模方式进行融合,形成一种多层级、多通道、多任务特征融合的显著性目标检测网络,并就各个深度特征的融合方式进行简要的叙述,通过与其他方法定性与定量的对比来证明这种融合方法的优越性。另外,通过增加自身的消融实验,证明了文中所提出的网络结构组成部分的有效性以及该方法在检测任务中的应用前景。
其他文献
人类对北极航道的探索起始于16世纪,但在北极严酷的气候和地理环境下,要有效利用这条新航道注定不是一件容易的事。近年来,全球气候的持续变暖让北极航道的常态化利用成为可能,越来越多的国家开始将目光投向北极航道,北极航道的规模化商业开发利用势在必行。出于经济、生态、战略发展等各方面利益的考虑,中国也开始制定北极政策并日益重视北极航道的开发利用,希望借这条新航道减少航运成本、保障运输安全、改善经济发展布局
随着我国基础设施建设的发展,桥梁的重要性日益凸显,对桥梁进行可靠的监测和检测变得越来越重要。检测与监测具备各自的优点,同时也具备着局限性。在本文中,尝试通过多源大数据融合理论将监测数据与检测数据融合,为桥梁的运营提供指导。以白涧河大桥为工程背景,进行有限元建模分析,将建模分析的数据与桥梁健康监测系统提取的数据进行一一对比,通过对比结果评估白涧河大桥的状态。介绍了白涧河大桥智慧健康监测系统,这为后续
认罪认罚从宽制度从试点到立法,体现了刑事诉讼法宽严相济政策的要求,符合现阶段司法实践对于提高诉讼效率的需要。该制度的推行,对被追诉人的权利保障提出了更高的要求,体现出对被追诉人主体性地位的尊重。该制度虽然在司法实践中取得了一定成就,但仍存在许多未尽完善之处,其中就包括被追诉人程序选择权的问题。作为一种程序性权利,程序选择权在该制度中扮演怎样的角色,其存在的正当性基础、合理运行的应然状态,值得从理论
巷道冲击灾变是煤矿动力灾害之一,主要发生在煤柱高应力、断层等地质构造区域。随着煤炭需求量的增加,浅部煤炭资源不断枯竭,煤矿开采逐渐进入深部开采状态。深部围岩受“三高一扰动”影响,巷道冒顶、冲击地压等事故不断增多,给煤矿安全生产带来严重威胁,尤其在深部断层构造区域开采过程中,断层与煤柱导致沿空巷道附近围岩结构复杂,巷道易发生灾变。因此,深部断层构造区沿空巷道灾变机理与安全控制方法亟需进行深入研究。在
在线信息转发和分享已经成为现代人最为普遍的媒介行为。拿起手机刷爆各大新闻信息流、分享和评论公共事件,已经是个体生活中必不可少的“媒介议程”。交流方式的革命促使新的传播行为和现象的形成。在当下这个风险社会,全球疫情仍在蔓延,社会距离不断拉大,网络人际距离却无限减小。同时,公共舆论事件频发、网络空间波涛汹涌,探讨个体——尤其是作为当前新媒体使用主要人群的大学生的信息分享行为机制,更加具有理论和实际价值
深度链接是指设链者可以在避开目标网络平台的交互界面跳转的条件下,通过设置链接,直接连接到被链网络站点数据库中存储的具体内容资源的信息网络技术手段。而互联网使用者在进行此操作时,其自身初次选择登陆的网络平台交互界面标识不会发生改变、域名地址亦不会进行变更,使用者仅通过主观判断,无法感知到当前交互界面已在后台完成网络站点间的跳转。深度链接作为—项信息网络技术,其初衷是为了通过设置深度链接,有效减少用户
随着科技不断发展和跨文化交流日益频繁,媒介在国家形象的建构和传播中发挥着重要作用,纪录片随之成为跨文化传播的重要媒介之一。近年以来城市形象的媒介建构和传播逐步成为国家形象构建必不可少的维度。因此,纪录片在城市形象构建过程中,发挥着展示城市符号,阐释城市文化的作用。对我国国产纪录片来说,如何在创作过程中更好的呈现城市形象便成为具有时代意义的课题。本论文基于纪录片跨文化传播视角,就中日两国对北京城市题
海洋中含有丰富的资源,对地球生命的延续有着决定性的作用。可见光在水下传播过程中,由于颗粒的散射和水的吸收作用,得到的水下图像很难满足人的视觉感知。光的散射容易导致水下图像变的模糊和细节模糊,光的吸收容易导致水下图像的颜色失真、图像对比度和图像亮度降低。由于水下光的吸收和散射使得水下目标的检测识别面临巨大的挑战。近年来,水下目标检测识别已经被广泛应用于海洋渔业、海洋军事、海洋保护、水下考古等领域。在
互联网高速发展的时代早已悄然来临。微信、微博、抖音等各种类型的即时通讯、分享软件不断壮大,用户体量迅速增长,带来了海量的信息资源和24小时不停歇的信息流转。在网络这样一个信息高速流通的空间中,诽谤内容发布和传播的容易程度、快速程度都远远超出了普罗大众的想象。网络信息的快速传播给不法分子创造了更多更大的实现机会,使其肆无忌惮制作或传播诽谤他人的内容,不仅严重地危害了其他公民为民法典、刑法、宪法等所保
学位