论文部分内容阅读
显著性目标检测,是指对于一幅图像,以最接近于人眼关注范围的方法将图像的较为突出或者比较重要的目标区域标注出来以便后续利用。众所周知,人类以及其他灵长类动物的视觉系统是相似的,面对一个现实场景或者一幅图像,在没有其他任务或者干扰的情况下,受关注的目标区域都会具有一定的特性,比如,背景全部是青草的情况下,中间点缀的一朵红花我们认为是显著,又或者,在空旷的沙漠中站立的一个人,这个也被认为是显著的。这些目标都具有这样一些特征:与背景对比度较大,占据整个场景或者图像较小的一个范围,在几何上是一个封闭的图形等。对于如上背景较为简单的情况下,已经有许多简单但是很有效的方法进行显著性检测,取得了很好的效果。但是,如果背景较为复杂,背景中干扰较多的情况,虽然目前也有很多的算法,但是效果都不能称得上理想,都会受到背景的一些干扰。而对于复杂背景来说,我们人类的视觉系统能够迅速并且准确地过滤掉背景当中的一些干扰并将注意力集中于真正明显的前景目标当中。基于这一点,显著性检测任务需要更加鲁棒的模型以适应复杂的现实环境。本文提出了一种基于循环全卷积的深度神经网络进行显著性检测。首先,利用传统的对比度特征,包括颜色、亮度等,计算出输入图像的初始显著图。然后,把原始图像和初始显著图同时送入神经网络进行训练。网络利用全卷积神经网络,每次网络输入一整幅图像,经过卷积和下采样运算对其进行编码,然后再把编码后的结果经过反卷积进行解码,最终得到和原图一样大小的显著图。同时该网络采用循环结构,把每次网络的预测输出结果再送入网络的输入,代替上个时间步的输入显著图,重新对网络进行修正。为了解决显著目标的尺寸问题,利用多尺度结构,将神经网络中间层的输出同样经过反卷积运算,并将其结果进行融合,从而对不同的显著性目标都能取得较好的效果。训练这种结构的网络如果仅仅用传统的训练方法,很容易进入局部极小值点,使网络无法得到彻底优化。本文提出了一种两阶段的训练过程,即预训练阶段和微调阶段,充分利用分割数据库丰富的监督信息,很好的避免了上述问题。本文算法在四个公开的显著性目标检测数据库上进行了评测,并与11种最新的经典算法进行了定性和定量的比较。实验结果表明,相对于其他经典算法,本文算法产生的显著图能够准确均匀地突出显著目标,在准确率-召回率曲线以及F-measure值的对比上,也展现了极大的优势。