复杂场景的显著性区域检测算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:langcy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
据2019互联网趋势报告显示,图像数量持续海量增加。面对海量的图像数据,如何快速准确提取有价值信息成为计算机视觉领域亟待解决的关键问题。显著性检测技术模拟人类视觉系统从图像中分割出感兴趣的目标或区域,进而为其他计算机视觉任务提供服务。自1998年,显著性检测领域发展了很多优秀的基于启发式规则的算法,近几年全卷积网络又将显著性检测推向一个新的高度。本文针对复杂场景的显著性区域检测进行研究,提出两种基于全卷积网络的显著性检测算法。主要研究内容如下:提出基于多尺度级联的注意力机制显著性检测模型。本文以全卷积网络为基本框架,同时借鉴循环神经网络思想,提出多尺度级联网络模型。该网络将上一时间步的输出送入到网络中继续参与训练,不断优化输出特征图。同时,针对全卷积神经网络无差别对待各特征通道和特征空间位置,提出基于前景背景的通道权重和基于显著性预测特征图的空间权重注意力机制。多尺度级联网络模型可以产生多个尺度的中间显著性预测特征图,利用这些预测特征图将浅层特征分成前景特征图和背景特征图,综合前景背景特征分布计算特征的通道权重。利用预测特征图计算特征图的空间位置权重使网络更关注显著性相关区域,抑制背景区域对显著性区域的干扰。在显著性检测领域六大基准数据集上同其它9种算法从定性、定量两方面进行对比分析,证明了基于多尺度级联的注意力机制显著性检测模型的优越性。早期,传统显著性检测算法依赖启发式规则捕获上下文信息,而基于深度学习的显著性检测算法依赖强大的学习能力捕获场景语义信息。为了同时捕获上下文信息和语义信息,提出基于启发式规则的全卷积神经网络。该网络结构分为多尺度级联网络流和启发式规则先验流。启发式规则先验流首先采用简单线性迭代聚类算法进行超像素分割,之后以超像素为基本单元计算颜色对比和颜色分布先验显著性特征图。先验显著性特征图采用动态通道加权的方式融入多尺度级联网络流多个尺度中。多尺度级联网络流借鉴全卷积神经网络和循环网络思想,在特征图逐级上采样的过程中进行监督学习,同时将上一尺度的预测显著性特征图迭代到下一尺度中,最终得到和输入图像尺度相同的预测显著性特征图。为了进一步优化显著性目标检测效果,本文将条件随机场直接融合到网络流中,实现检测、优化一体化。通过与其他算法进行实验对比分析,证明了基于启发式规则的全卷积网络在各个场景中具有更好的检测性能。
其他文献
随着云计算、大数据在全球范围内的广发应用,数据中心的数量和规模不断增长,其高能耗、高费用等问题日益突出。越来越多的数据中心运营商尝试利用风能或太阳能等可再生能源为其数据中心供电。然而,可再生能源具有间歇性和随机性,给数据中心的供电管理带来了诸多挑战。虚拟电厂能够整合大量的可控负荷、分布式电源以及储能等多种分布式能源,为数据中心的能量管理提供了有效的途径。本文在虚拟电厂环境下,基于随机规划,重点探讨
随着传统汽车造成的环境污染危机愈发严重,纯电动车和可再生能源受到人们越来越多的关注。相应地,质子交换膜燃料电池(PEMFC)由于较高的能量转换率(30%~60%),运行噪声小和环境友好的特点,并且凭借高能量密度的优势,在新能源汽车发展中有巨大的潜力。通过引入动力电池组可以弥补燃料电池电动汽车无法回收制动能量、启动速度慢和输出特性偏软的缺点。双动力源可以使燃料电池混合动力汽车发挥更好的动力性,但是如
随着我国经济社会的高速发展和城市化进程的推进,机动车的数量日益增加,随之带来的城市交通问题也日益凸显。诸如交通拥堵、交通事故和汽车尾气造成的环境污染等问题,对城市区域路网的通行效率和市政交通管理都造成了严重的影响,城市交通管理者们迫切需要寻找合理高效的交通管制方案解决这些问题。而在影响城市区域交叉口通行能力的众多因素中,交叉口信号灯优化控制是至关重要的因素之一,也是现代交通管理的主要内容。利用在线
进入21世纪以来,我国经济快速发展,环境污染、生产隐患、资源浪费等问题随之产生且日趋严重。社会公众高度关注企业履行社会责任。能源企业作为我国国民经济支柱性产业,它关
随着人工智能技术的飞速发展以及知识图谱在垂直领域应用技术的成熟,知识图谱在医疗领域有着广阔的应用前景。医疗知识图谱可以帮助医生做决策、帮助大众了解疾病常识、帮助病人了解患病情况,知识图谱在医疗领域的价值不仅仅是一个医学知识库,更重要的是提供诸如医疗智能搜索等功能,是辅助诊疗的基础。随着医学信息化水平的提高以及大数据的发展,医疗领域积累了大量未被充分利用的数据,构建医疗知识图谱可以充分挖掘数据的潜在
随着建筑业的快速发展,因升降机人数超标而导致的重大安全事故时有发生,给国家和人民生命财产造成重大损失。论文设计了一种基于人数检测的施工升降机安全监控系统。论文讨论了远红外信号的空间传输通道问题,详细设计了安装传感器的多腔体结构。设计了远红外人数检测模块和升降机安全监控模块的硬件电路,包括ARM处理器电路、远红外信号调理电路、重量和高度传感器调理电路、NB模块连接电路、声光报警电路、升降机供电控制电
中文图像描述任务(Chinese Image Caption)作为跨学科跨领域的交叉研究问题,实质就是使计算机能够自动的对图片生成一句描述性中文,这对人来说很容易,对机器来说却很有挑战性。计算机需要提取图像的物体特征、空间联系、语义关系等信息,生成人类可读的能清晰表达出图像内容的句子,并力求句子准确、通顺。在中文图像描述任务中,基于神经网络的图像描述成为目前主流的研究方法,其中大多数都是采用编码器
相变存储器(Phase Change Random Access Memory,PCRAM)是一种具有优良性能的新型非易失性存储技术,具有良好的应用前景。相变材料铬掺杂碲化锑(Cr-SbTe)具有热稳定性高、结晶速度快等优势,具备替代传统相变材料锗锑碲(GST)的潜力。要实现先进相变材料工艺集成,与之相关的相变材料刻蚀是PCRAM制备的关键工艺。因此本文主要从Cr-SbTe薄膜的刻蚀工艺参数优化及
当今时代,人的作用在企业发展中越来越受到重视,人才是企业在瞬息万变的市场竞争中立于不败之地的根本保证,现代人力资源管理实践中往往将人力资源管理归纳为选、用、育、留四大功能,要发挥这四大功能,做好员工激励是核心和关键,一套科学、合理的员工激励方案,能够有效吸引人才、激发人才的主观能动性,促进企业的发展。目前虽然各大企业都非常重视员工激励,但有些企业特别是国有企业受体制机制的影响,“大锅饭”现象还不同
无人驾驶汽车自问世以来一直受到国内外车企的广泛关注,而可靠的视觉感知系统是对无人驾驶技术的重要支撑。交通标志承载着重要的道路行驶信息,系统准确地检测交通标志有利于引导驾驶员安全行驶,同时对于提升无人驾驶汽车的场景理解能力也有着重要意义。得益于硬件计算能力的提升以及广泛学者的研究,近年来深度学习发展迅速。尤其在计算机视觉领域,深度卷积神经网络已取得众多突破性成果。在图像识别、目标检测、图像语义分割等