论文部分内容阅读
视觉显著性是指人们观察外界事物时,视觉系统能够自主探测、感知场景中各个位置的敏感性信息。该原理来源于人类视觉系统的仿生研究成果,它依据认知神经原理建立计算模型,构建类似于神经系统捕捉、处理外界信息的过程,实现场景中显著性目标的感知。视觉显著性计算的通用性、高效性使之成为当下目标检测的重要研究分支之一。本文分析总结了已有的显著性研究工作,改进现有模型在复杂场景情况下的不足之处,并取得了更好的检测效果。在简单场景图像条件下,基于视觉显著性的目标检测容易取得好的效果。对于复杂场景图像,基于单幅图像显著性信息的目标检测方法往往不能进行准确的目标区域检测与判断,利用多幅相关图像的联合显著性可以融合更多信息,抑制复杂背景,突出显著目标,提高目标检测质量。视频图像序列作为人们生活中最常见的相关图像集合,其中的运动信息又是人类视觉系统中非常重要的感知线索,利用运动信息实现视频图像的显著性目标检测,是本文的重要研究内容。同时,不同视角的图像亦可以提供更多的目标和背景区域信息,多视角图像的显著性目标检测是本文的另一个研究重点。主要贡献归纳为以下两点:(1)视频中显著性目标检测在视频图像序列中,利用图像在时间上的关联性,提取运动特征,分别分析各位置的运动幅度和运动方向,将运动特征与静态颜色对比度特征融合,得到空-时联合显著性目标检测方法,突出视觉系统对运动目标的敏感性。在多个视频测试序列中,本文的方法相比于现有模型有更好的检测效果。(2)多视角图像显著性目标检测将场景的单视角扩展到多视角,分析场景在不同视角下前景与背景之间的空间关系,通过空间投影计算出不同视角下目标周围被遮挡的背景区域,并将其应用到显著性目标检测中,即本文的多视角联合显著性目标检测方法。实验结果表明,该方法能有效抑制目标周围的复杂背景,获得良好的目标边界。