基于循环全卷积网络的显著性检测

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:y1271
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
显著性目标检测,是指对于一幅图像,以最接近于人眼关注范围的方法将图像的较为突出或者比较重要的目标区域标注出来以便后续利用。众所周知,人类以及其他灵长类动物的视觉系统是相似的,面对一个现实场景或者一幅图像,在没有其他任务或者干扰的情况下,受关注的目标区域都会具有一定的特性,比如,背景全部是青草的情况下,中间点缀的一朵红花我们认为是显著,又或者,在空旷的沙漠中站立的一个人,这个也被认为是显著的。这些目标都具有这样一些特征:与背景对比度较大,占据整个场景或者图像较小的一个范围,在几何上是一个封闭的图形等。对于如上背景较为简单的情况下,已经有许多简单但是很有效的方法进行显著性检测,取得了很好的效果。但是,如果背景较为复杂,背景中干扰较多的情况,虽然目前也有很多的算法,但是效果都不能称得上理想,都会受到背景的一些干扰。而对于复杂背景来说,我们人类的视觉系统能够迅速并且准确地过滤掉背景当中的一些干扰并将注意力集中于真正明显的前景目标当中。基于这一点,显著性检测任务需要更加鲁棒的模型以适应复杂的现实环境。本文提出了一种基于循环全卷积的深度神经网络进行显著性检测。首先,利用传统的对比度特征,包括颜色、亮度等,计算出输入图像的初始显著图。然后,把原始图像和初始显著图同时送入神经网络进行训练。网络利用全卷积神经网络,每次网络输入一整幅图像,经过卷积和下采样运算对其进行编码,然后再把编码后的结果经过反卷积进行解码,最终得到和原图一样大小的显著图。同时该网络采用循环结构,把每次网络的预测输出结果再送入网络的输入,代替上个时间步的输入显著图,重新对网络进行修正。为了解决显著目标的尺寸问题,利用多尺度结构,将神经网络中间层的输出同样经过反卷积运算,并将其结果进行融合,从而对不同的显著性目标都能取得较好的效果。训练这种结构的网络如果仅仅用传统的训练方法,很容易进入局部极小值点,使网络无法得到彻底优化。本文提出了一种两阶段的训练过程,即预训练阶段和微调阶段,充分利用分割数据库丰富的监督信息,很好的避免了上述问题。本文算法在四个公开的显著性目标检测数据库上进行了评测,并与11种最新的经典算法进行了定性和定量的比较。实验结果表明,相对于其他经典算法,本文算法产生的显著图能够准确均匀地突出显著目标,在准确率-召回率曲线以及F-measure值的对比上,也展现了极大的优势。
其他文献
MIMO-OFDM系统是无线通信领域的研究热点,多目标资源分配是MIMO-OFDM系统中的关键技术。快速非支配排序遗传算法(NSGA-Ⅱ)常用来解决多目标优化问题。论文即是将NSGA-Ⅱ算法应
学位
自动交换光网络(Automatic Switched Optical Network)由于引入了控制平面才成为智能光网络,而控制平面的具体实现要依靠通用多协议标记交换GMPLS协议,而控制平面是整个ASON的
近年来,分数阶积分变换在信息处理领域中受到了广泛关注,各种新型分数阶变换作为重要的数学工具不断被应用到光学信息处理和数字信号处理等领域中。本论文分别介绍了分数Sumu
井下自组织网络需要成千上万的网络节点,这些节点需要含电量很少的纽扣电池供电,为了使整个系统保持良好的稳定性,因此需要系统在节能方面有良好的表现。  对井下自组织网络S-
社会化网络服务(Social Network Service, SNS)作为一种新兴的互联网应用模式,正受到人们越来越多的关注。SNS网站数据对于经济预测、疾病研究、舆情分析等都具有重要的意义,然
视频编码过程中,基于编码单元特点选取合适的编码模式(分割模式和预测方向),是模式选择的主要任务。最优的编码模式需同时满足码率和失真两方面内容,即码率一定失真最小。为了选择
在信息检索领域,如何有效地理解、检索大规模的数据库以及从海量图像中获取所需信息已成为一项极具价值的研究。因此,探索一种实用的基于内容的图像检索模型,尤其是寻求优秀的特
随着无线通信业务的快速增长,无线通信可利用的有限频谱资源日益稀缺。认知无线电(CR)通过伺机地接入授权频谱以提高频谱利用率,是未来无线通信系统中的一个重要技术。无线中继
随着汽车数量的急剧增加,应用电子警察系统实施科技执法成为必然趋势。在查处违规占道、违规停车、未年检车辆和套牌车辆等应用中,基于车载视频的车辆判别技术是电子警察系统