论文部分内容阅读
复杂场景中的运动目标检测及目标分割是计算机视觉领域中的难点问题,在智能监控、智能机器人、基于目标的图像和视频分析领域都具有重要的应用价值。但是对计算机来说颇为困难的目标检测及分割任务,对人类大脑却是相当容易的,这正是因为人类视觉系统具有卓越的视觉认知能力,能完成检测、跟踪、识别目标等一系列视觉任务。因此学习和借鉴人类视觉系统的生物认知机制来研究视频分析问题受到学界越来越多的关注。本文主要研究内容有:符合人眼视觉关注的复杂动态场景中的时空显著性计算模型、鲁棒的运动目标检测及视频目标分割算法等。本文的主要工作和创新点包括:第一,提出了一种生物启发的复杂户外场景中的运动目标检测方法。神经科学家们研究发现人类大脑的内侧上颞区(MST)可以感知视觉运动信息,且来自视觉感知的运动场在MST区域能被分解成若干独立成分。受此启发,我们提出将光流的独立成分分析(ICA)与主成分分析(PCA)结合起来,用来检测复杂的户外场景中的运动目标。首先,利用ICA可以从信号中分离出统计独立的源信号的特点,我们对光流场应用ICA,将连续帧的前景光流和背景光流大致分开。考虑到前景光流中依然存在由于复杂场景引起的噪声,我们再对前景光流场进行主成分分析,使得对应于运动目标的主要光流能被有效增强、背景中的噪声相对地被抑制,使得最后运动目标可以被较好地检测出来。与常用的运动目标检测方法的实验结果相比,该生物启发的方法可以较好去除背景噪声,从复杂场景中有效地检测出运动目标。第二,提出了一种基于大脑认知启发的视觉关注模型。首先模仿大脑对运动信息的认知机制,用鲁棒的独立成分分析算法将显著的前景光流检测出来,其次受到人类视觉关注总是集中在前景目标上的启发,通过Meanshift算法将方向、强度相似的前景光流矢量聚类,再通过本文提出的相对显著运动区域选择策略产生前景目标区域,计算前景目标区域的光流强度继而生成时域的显著图。同时,我们采用基于图的视觉显著性模型来计算空间的显著性。最后,时空显著性被标准化后进行线性融合生成时空显著图。实验和结果分析说明该认知启发的模型在真实的人类视觉关注点位置处可以得到较好的显著区域定位。第三,提出了一种基于时空显著性的视频目标分割算法。首先,通过快速光流算法计算连续帧之间的运动信息,接着通过判断当前帧是否存在全局运动来相应调整初步的光流结果,产生较为准确的运动显著性。然后将时域显著性和基于区域对比的图像显著性检测结果进行加权融合,从而突出时间上和空间上显著的前景目标。最后通过马尔可夫随机场进行前景-背景标记,从而自动地分割出静止的和运动的视频目标。通过在多种复杂场景的数据库上的测试,实验结果表明本文方法快速、有效,特别对动态背景下的目标分割问题,本文提出的基于时空显著性的视频目标分割方法鲁棒性更强。