论文部分内容阅读
图像显著性检测的目的在于识别一幅图像在视觉上最突出的区域,是计算机视觉及图像处理领域中一项非常重要的课题。显著性检测作为一种预处理手段在计算机视觉及图像处理方面有着广泛的应用,如多媒体信息传输,图像视频重构,图像视频质量评估等。同时,显著性检测在高层次视觉任务中也被大量应用,如物体检测,身份识别。作为一门非常成熟的课题,各种显著性检测模型不断涌现。传统显著性检测模型通常包括基于手工特征的方法和基于先验知识的方法。基于手工特征的方法致力于设计各类手工特征如颜色、亮度、纹理,当图像具有较为复杂的语义时,这类方法难以有效的检测出显著性主体,当主体与背景的颜色、亮度差异较小时,基于手工特征的方法无法有效的将显著主体从背景中区分出来。基于先验知识的方法试探性的在显著性检测过程中定义先验条件,如基于背景先验的方法假定靠近图像边缘区域为背景,但有些图像的显著主体处于图像边缘,这使得基于先验知识的方法具有局限性。为了解决传统方法的不足,我们认为需要建立一个自适应纯数据驱动模型,有效检测显著主体的内在语义以及与背景的差异,同时模型应该从不同角度去检测显著性(全局和局部角度)。因此,本文提出了一种全局和局部结合的多尺度图像显著区域检测方法。采用深度卷积神经网络建立一个自适应纯数据驱动模型,利用并行网络综合图像的各尺度信息,得到了更加精确的显著性检测结果。本文工作的主要贡献如下:1)对原始图像进行超像素分割预处理,以超像素作为基本处理单元,既保证了基本单元内部良好的关联性和紧凑结构,又减少了后期的计算量;2)本文设计了并行深度卷积神经网络模型,包括全局网络CNN-G和局部网络CNN-L,分别从全局和局部两个方面综合检测图像显著性。同时,为增强显著图的连贯性和一致性,在局部模块采用了双路并行网络,利用多种尺度信息更为精确的计算显著性;3)实验表明,本文模型所得到的显著图结构更加紧凑,细节更加完整,显著区域轮廓清晰柔和,边界连续。我们在MSRA10K、DUT-OMRON和ECSSD三个显著性检测公开数据库上都取得了不错的效果,具有更好的PR曲线和更高的F-measure值,检测准确性和完整性高于现有主流方法。