论文部分内容阅读
显著性目标检测是通过算法自动提取一幅输入图片中视觉最突出明显并且最吸引人类注意力的区域。其可以作为许多计算机视觉任务的预处理步骤,比如场景分类、目标跟踪、视频压缩以及动作识别,减轻后续工作的复杂度,降低冗余信息的干扰,提高图像处理的效率。本文首先提出结构特征结合跳跃式短连接网络,及另一个独立的双向环形特征金字塔网络,以丰富特征的提取,促进信息的交互融合,并作为后续工作的基础架构。为了缓解前景目标漏检和边缘轮廓模糊的问题,提出融合最近邻算法的分层优化网络以及递进式两阶段可分离架构。本文的主要工作如下:1.为了增强对前景目标的敏感度,提出一个多尺度特征提取模块,从不同感受野中提取方向引导的结构信息。将其结合跳跃式短连接信息融合策略,加速信息的流动,促进深层次低分辨率上下文语义特征和浅层次高分辨率空间边缘感知信息的相互补充。此外,设计了融合自上而下和自下而上的环形信息流以增强特征层次性表征能力的双向环形特征金字塔网络。2.由于卷积层的参数化决策机制以及滑动窗口所引起空间相关性的缺失,使用单一尺度的11×或者33×卷积核作为网络最终的分类器预测显著性图将加剧目标漏检以及边缘模糊的问题。最近邻算法基于非参数化决策机制和全局特征对比度计算,因此将其作为辅助的优化流程,构建一个自顶向下、自深到浅的多层次卷积网络架构,逐步恢复前景区域内部结构的完整性,获得相对清晰的目标边缘轮廓,一定程度缓和上述问题。3.在最近邻算法的积极推动下,对模型的架构进一步分析和优化,提出递进式两阶段可分离优化网络,其以先后顺序执行平行多重感受野分类器和最近邻算法。该网络既可以使用联合监督直接端到端地生成高置信度的显著性预测图,也可以作为后处理操作采用异步监督对其他算法的推测结果进一步优化。在六个公开的基准测试数据集上进行定性和定量的实验,相比18个最新的卷积网络模型,本文所提出的架构在检测精度和泛化能力上展现了大幅度的提升。