论文部分内容阅读
人类视觉注意力机制研究表明,视觉场景中的不同对象对人类具有不同的吸引程度。如何通过计算机模拟人类的视觉特点,提取图像中的感兴趣的区域,即显著区域,是显著性检测的基本问题。图像显著性研究的主要任务是让计算机视觉系统能够模拟人类的视觉能力去准确地检测图像中的显著区域。近年来,图像显著性研究受到业界的广泛关注。各种显著性检测方法被相继提出,然而现有工作大多局限于处理单幅图像中的独立显著目标。在实际生活中,人们感兴趣的目标往往是一组图像中共同的前景物体或同类的物体。因此人们需要结合图像组中的上下文信息才能确定感兴趣的目标。如何从一组图像中检测出各图像共同的显著目标,是协同显著性检测的基本任务。在图像协同显著性检测方向上虽然已经开展了大量的研究工作,然而实际场景受到光照、视角、遮挡、形变等复杂环境的影响,共同显著目标的外观具有不确定性,增加了协同显著性检测的难度。因此现有方法在协同显著性检测上的性能仍然不够理想,亟待研究更为有效的图像协同显著性检测方法。本文对图像协同显著性检测方法进行了系统深入的研究,主要工作内容及创新点总结归纳如下:
1、提出了一种综合超图优化与种子传播的无监督协同显著性检测方法。该方法迭代优化了超图结构、特征学习以及显著性种子点传播。通过优化超图结构自适应地建模了超像素之间的高阶关系,为显著性标签预测提供了传播依据。实验结果表明了所提方法能够有效处理图像组中存在的噪声图像以及不同场景下显著目标的外观变化,增强了协同显著性检测的性能。
2、提出了一种基于自适应特征学习的半监督协同显著性检测方法。该方法综合优化了多视角视觉特征、图结构以及协同显著性标签预测。其中,多视角特征学习能够使模型应对特征中的噪声和冗余,提升方法的鲁棒性。图形结构与特征学习以及协同显著性预测共同优化,以精确地表征区域之间的潜在相关性。实验结果表明,本文所提出的方法能够在不同情景下合理有效地使用多种视角特征,在多个公开数据集上均有效提升了协同显著性检测精度。
3、提出了一种基于多任务深度神经网络的协同显著性检测方法。该网络结构由图像组共同语义学习分支和协同显著性检测分支组成,两个分支分别通过图像组共同类别标签与协同显著性标签图作为监督信息进行协同训练。在该方法中,我们利用多尺度融合策略提升了显著图的细节表达能力,同时通过图像间与图像内注意力机制来增强共同语义特征表达的准确性。实验结果表明本文提出的方法能够克服图像中噪杂的背景,并获得可靠的协同显著性检测结果。
1、提出了一种综合超图优化与种子传播的无监督协同显著性检测方法。该方法迭代优化了超图结构、特征学习以及显著性种子点传播。通过优化超图结构自适应地建模了超像素之间的高阶关系,为显著性标签预测提供了传播依据。实验结果表明了所提方法能够有效处理图像组中存在的噪声图像以及不同场景下显著目标的外观变化,增强了协同显著性检测的性能。
2、提出了一种基于自适应特征学习的半监督协同显著性检测方法。该方法综合优化了多视角视觉特征、图结构以及协同显著性标签预测。其中,多视角特征学习能够使模型应对特征中的噪声和冗余,提升方法的鲁棒性。图形结构与特征学习以及协同显著性预测共同优化,以精确地表征区域之间的潜在相关性。实验结果表明,本文所提出的方法能够在不同情景下合理有效地使用多种视角特征,在多个公开数据集上均有效提升了协同显著性检测精度。
3、提出了一种基于多任务深度神经网络的协同显著性检测方法。该网络结构由图像组共同语义学习分支和协同显著性检测分支组成,两个分支分别通过图像组共同类别标签与协同显著性标签图作为监督信息进行协同训练。在该方法中,我们利用多尺度融合策略提升了显著图的细节表达能力,同时通过图像间与图像内注意力机制来增强共同语义特征表达的准确性。实验结果表明本文提出的方法能够克服图像中噪杂的背景,并获得可靠的协同显著性检测结果。