论文部分内容阅读
认知心理学家经过大量详尽的实验研究表明,人类具有快速获取视觉场景中显著的或者感兴趣的目标的能力。为了使现代计算机也具备类似的信息处理能力,越来越多的研究人员对视觉显著性目标检测技术进行了相关研究。近些年来,视觉显著性目标检测技术已经成为计算机视觉和图像处理领域的热门研究课题。视觉显著性目标检测技术的目标是辨识并分割出图像中吸引人类视觉注意的显著性物体或者区域。作为一种图像预处理方法,它不仅可以促进计算机对图像场景的理解,还可以普遍提高下游相关视觉任务的性能,如图像的识别、检索、分割、压缩、恢复等。同时,随着硬件技术的快速发展,显著性目标检测技术也在尖端科技领域发挥着越来越大的作用,如自动驾驶、人机互动、工业机器人等。因此视觉显著性目标检测技术的研究具有广泛的应用前景和深远的科学意义。当前,虽然在视觉显著性目标检测领域的研究已经取得了较大的进展,但是在杂乱场景、低对比度成像环境或者物体不明显时,显著性目标检测算法的精度和效率仍然不太理想。针对以上问题,本文将依托有效的深度学习技术,特别是全卷积神经网络模型,对视觉显著性目标检测算法进行相关研究。本文的主要工作和研究创新如下:(1)根据深度卷积网络的不同层的视觉特性,本文提出了一种基于多层次卷积特征聚合的显著性目标检测模型。具体地,为了更好地融合多层视觉特征,本文提出了一种基于分辨率的特征组合方法。该方法首先将不同分辨率下的深度特征进行适当的收缩或扩张,使其保持相同的分辨率,然后将不同层次的特征进行加权自适应聚合。该方法消除了多层次深度特征的分辨率不匹配问题,同时增强了深度特征的表示能力。为了促进多层特征之间的信息交互,本文还提出了多层次监督学习方式对网络进行训练。该训练方式首先将监督信息应用于网络的多个侧输出,然后将多个损失函数联合优化,完成多层次的显著性目标检测。它能够显著地提高模型对显著性目标的检测能力。本文所提出的算法具有很强的通用性,可迁移到其他有效的深度卷积神经网络上。在国际公开的测试数据集上,该算法的显著性目标检测效果相较于同时期其他算法有明显的提升。(2)针对现有的显著性目标检测算法常常忽略模型的鲁棒性,本文从卷积特征集成的角度,提出了一种基于不确定性卷积特征学习的显著性目标检测算法。该算法首先将随机失活(Dropout)进行基于特征元素的修正,得到的全新表示形式可认为是将特征元素进行概率化的集成。通过将其应用于卷积特征图上,可以提取到多层次不确定性卷积特征。基于卷积化的编码-解码结构,所提出的全卷积模型可以进行端到端的显著性目标检测。同时,为了有效地降低反卷积上采样过程中的“棋盘伪影”,本文还构建了一种混合上采样方式,它很好地继承了反卷积和插值操作的优势,可以提升预测图的光滑性。该算法相较之前算法在模型鲁棒性方面有显著提升,在检测精度和泛化性方面也取得了优异的结果。(3)针对现有深度模型缺乏对互补性特征和结构化监督信息的利用,本文提出了一种基于无损特征反射和结构化损失函数的显著性目标检算法。显著性目标检测任务主要关注前景和背景的可分离性。而图像本征反射和镜面变换可以很好地将图像中的信息进行分解。有鉴于此,本文提出的算法首先将原始图像通过镜面反射变换为内容保持的镜面图,然后利用对称全卷积神经网络分别提取互补的视觉特征,进而利用多层特征融合策略进行特征交互,以促进特征的融合。最终通过结构化损失函数进行监督训练得到精确的显著性图。通过大量的实验分析,该算法能够在国际知名的数据集上取得优异的性能,同时对显著性目标的边界精度也有很大的提升。最后,本文给出当前显著性目标检测算法仍面临的问题和挑战,同时针对这些问题给出了显著性目标检测算法的未来研究趋势。