论文部分内容阅读
随着大数据时代的来临,如何从海量的图像中获取有用信息成为了计算机视觉领域的重要研究范围。图像显著性检测通过模拟人类视觉注意力机制,能够从复杂的视觉场景中快速定位人们所感兴趣的图像区域。如今,图像显著性检测算法的应用越来越广泛,已经被应用在图像压缩,图像检索,图像分割等领域。目前图像显著性检测算法可以分为基于低层视觉特征的自底向上的图像显著性检测算法以及基于深度学习的自顶向下的图像显著性检测算法。现有的基于低层视觉特征的自底向上的图像显著性检测算法可以分为基于空域特征的图像显著性检测算法和基于频域特征的图像显著性检测算法。本文通过实验分析,总结出基于空域特征的图像显著性检测算法适合检测显著目标与背景的颜色特征对比度强烈的图像,而基于频域特征的图像显著性检测算法适合检测显著目标与背景的颜色特征对比度不强烈的图像。目前在该领域还没有能够同时适合检测上述两种类型图像的算法。此外,在基于深度学习的自顶向下的图像显著性检测算法领域,由于基于U-Net的模型通过提取图像的高级特征以及全局信息获得显著信息,提取的显著信息缺乏低层视觉信息,检测的显著图边界不够精确,具有稀疏性和不规则性。针对以上问题,本文主要的研究内容如下:(1)提出了一种新的融合图像空域特征和频域特征的自适应图像显著性检测算法。具体地,该算法通过Res Net18将图像分类为显著目标与背景的颜色特征对比度强烈的图像和显著目标与背景的颜色特征对比度不强烈的图像,通过基于图像空域特征和频域特征中代表性的图像显著性检测算法分别计算上述两类图像的前景显著图。然后将其与输入图像的背景先验显著图进行贝叶斯融合获得中间显著图,最后采用条件随机场优化得到最终显著图。实验结果显示,该算法的检测效果优于当前大部分的自底向上的图像显著性检测算法。(2)提出了一种基于注意力机制和U-Net的图像显著性检测算法。具体地,该算法通过在U-Net模型解码器阶段,将上述算法检测的显著图与特征图构建多尺度特征融合丰富显著图的空间信息和局部信息,采用通道注意力机制提取关键特征优化显著图的稀疏性和不规则性,构建多尺度加权损失函数促进显著图更接近真值图。实验结果显示,该模型比U-Net模型具有更好的图像显著性检测效果,同时也优于近几年主流的其它基于深度学习的图像显著性检测算法。