论文部分内容阅读
随着计算机视觉的发展,视频的目标跟踪问题已经成为例如行为分析、行为识别和医学图像、刑侦追踪等领域的核心问题。视频跟踪主要是通过对摄像头捕捉到的图像序列进行分析,从每一帧的图像中捕捉到目标物体,并将图像序列中的目标跟踪物体关联起来得到可以刻画视频与目标的模型,用于下一帧的目标跟踪。实际上视频跟踪就是建立仿生视觉运动感知系统,得到每一帧目标物体的位置形态。视频跟踪的难点在于复杂的物体运动,巨大的噪声,光线变化以及繁杂的背景。受益于粒子滤波的发展,视频跟踪问题已经转变为了贝叶斯推断问题。这篇文章提出了一种在粒子滤波框架下的用于鲁棒视频跟踪的新颖的子空间学习方法(Latent Subspace Projection Pursuit, LSPP)。传统的子空间视频追踪方法都是先估计子空间的维数,然后学习子空间的基底用于构造子空间上的投影。不同于传统的基于子空间的视频追踪方法,我们的方法直接学习潜在子空间上的一个已知秩的低秩投影,这个已知的秩就是潜在子空间的维数,那么在视频跟踪过程中,我们就可以用这个低秩投影来描述子空间的结构。在粒子滤波视频跟踪框架下,我们用一种在线的递增的方法追踪最优的投影,并且最小重建误差对应的候选者用于向下一帧传递视频跟踪的信息和追踪投影。定义在潜在特征子空间上的投影的列向量是该空间上的一组冗余的基底,重建时将观测向量直接作为系数。所以,追踪到的最优的投影的低秩性可以准确的揭示全局特征子空间的低维特性,这也是可以准确抓住跟踪物体的变化的主要原因。在一些具有挑战的图片序列上的实验结果表明,我们的方法比一些顶尖的视频追踪方法好。