论文部分内容阅读
基于深度神经网络的算法在显著性目标检测方面取得了重大突破。然而,这些算法均受限于相当有限的输入分辨率(即,400×400甚至更低)。几乎没有研究致力于如何直接针对高分辨图像做精细的显著性目标分割。本文首次提出了高分辨率显著性目标检测这一重要任务,并针对该任务新建了一个高质量数据集以及设计了一些相关算法。具体工作和贡献如下:高分辨率显著性目标检测数据集。为促进高分辨率显著性目标检测任务的进一步研究,本文新建并细致标注了一个高分辨率的、高质量的显著性目标检测数据集。该数据集包含4010张训练图片和1000张测试图片,每张图片都有相应的像素级精细标注。据我们所知,我们新建的数据集是国际上首个高分辨率的显著性目标检测数据集。由粗糙到精细的高分辨显著性目标检测算法。针对现有显著性目标检测算法对高分辨率图像的预测存在边缘模糊的问题,本文提出了由粗糙到精细的高分辨显著性目标检测算法。该算法将全局语义信息和局部高分辨率细节结合在一起,以解决这一具有挑战性的任务。更具体地说,我们的方法包括全局语义网络,局部细化网络和全局-局部融合网络。全局语义网络基于下采样的整个图像提取全局语义信息。在全局语义网络预测结果的指导下,局部细化网络着眼于某些局部区域,并逐步产生高分辨率的预测。全局-局部融合网络被进一步提出来增强空间一致性并提高性能。基于深浅残差融合网络和测试阶段微调调的高分辨率显著性目标检测算法。现有的显著物体检测方法通常面临两个挑战。第一,模型通常被训练来更多地关注语义,因此,产生的分割边界通常是模糊的或粗糙的。第二,由于训练集上的归纳偏差,现有模型无法很好地推广到未曾见过的内容或具有挑战性的场景。为了解决第一个挑战,本文提出了一种名为深浅残差融合网络的新模型,该模型利用高层的语义信息和低层的边界细节来产生高质量的分割结果。具体而言,本文提出的深浅残差融合网络由一个负责编码语义的深分支、一个负责提取边界细节的浅分支和一个用于合并两个分支优势的残差特征融合模块组成。对于第二个挑战,我们提出了一种测试阶段微调算法,以有效地从测试图像中提取其特定的图像信息,并将其用于自我细化的预测。实验表明,我们提出的方法在高分辨率数据集上的性能大大优于现有经典算法,并且在多个广泛应用的显著性基准数据集上,也具有足以媲美甚至更优秀的性能。视觉结果表明,所提出的方法能够准确检测出显著目标并抑制背景噪声。此外,我们的显著性检测结果具有更好的边界形状,并且在多个极具挑战性的场景中更接近于真值图。