论文部分内容阅读
作为计算机视觉的基础问题之一,在线目标跟踪在很多研究方向上(比如运动分析、视频压缩和行为识别等)都处于核心位置,并且有着广泛的实际应用(比如视频监控、智能交通和机器人导航等)。尽管在线目标跟踪的研究在过去几十年里有很大进展,但是由被跟踪目标外观变化带来的困难使得设计一个鲁棒的在线跟踪算法仍然是一个富有挑战性的课题。这些困难来自内在因素(比如姿态变化、形状变化等)和外在因素(比如变化的光照、相机运动和遮挡等)。本文专注研究线性表示模型来设计有效的观测模型,从而实现鲁棒的在线视觉跟踪。本文的主要贡献如下:首先,本文提出了一种增量正交映射非负矩阵分解算法(IOPNMF),该算法旨在增量地学习一个基于部分的子空间来反应动态数据流。通过假设新加入的样本仅仅影响基向量而不影响旧样本的编码系数,本文提出了一个用于在线学习的目标函数,并提出了一个乘法更新准则对其进行求解。人脸分析实验表明,与现有的非负矩阵分解算法相比,本文提出的算法能够保证以在线的形式学习到一个基于部分的子空间。本文还利用在IOPNMF基向量上的重构误差设计观测似然函数,并且据此提出了基于IOPNMF的跟踪算法。实验结果表明,基于IOPNMF的跟踪算法取得了和基于增量主成分分析的跟踪算法相当的效果。其次,本文提出了一种基于稀疏原型的目标跟踪算法,该算法能够利用经典的主成分分析(PCA)和当前热门的稀疏表示机制来学习有效的外观模型。对于稀疏原型模型来说,被跟踪的目标被建模为PCA基向量和琐碎模板的线性组合,其中PCA基向量上的系数不是稀疏的而琐碎模板上的系数是稀疏的。该表示模型同时考虑了目标外观的变化和异常噪声(比如遮挡)的情况,并且可以利用本文提出的迭代算法来有效地求解。在稀疏原型模型的基础上,本文通过提出一种新颖的观测似然函数和一种合理的模型更新机制来设计一个鲁棒的跟踪器。实验结果及讨论表明了该跟踪算法的有效性,效率和扩展能力。再次,本文提出了二维稀疏原型模型来描述被跟踪的目标,该模型将图像观测直接看作二维矩阵而非一维向量。二维稀疏原型由二维主成分分析的基矩阵和一个附加的稀疏噪声矩阵组成,并且本文提出了一种有效的迭代算法来求解该表示模型。基于二维稀疏原型模型,本文提出了一种新的观测似然函数,它同时考虑了重构误差和误差矩阵的稀疏性。该似然函数不仅能够有效地处理部分遮挡而且能够促使被跟踪目标很好地对齐。此外,本文还证明了二维稀疏原型模型和稀疏原型模型拥有相似的表示形式。实验结果表明基于二维稀疏原型的跟踪器与基于稀疏原型的跟踪器表现相当,并且前者的计算代价较小。最后,本文总结了基于线性表示模型的跟踪算法并指出两个关键问题:如何鲁棒地求解表示系数以及如何在噪声观测下定义一个观测样本与模板子空间之间的鲁棒的距离。本文将观测噪声假设为高斯分布和拉普拉斯分布的加性组合(称为“高斯-拉普拉斯”分布),并从最大联合似然估计的角度提出了一种最小软阈值均方回归算法。随后,本文提出了一种有效的迭代算法来求解最小软阈值均方回归问题,该迭代算法可以获得全局最优解。另外,本文证明了从求解回归系数的角度来看,本文提出的最小软阈值均方回归与Huber鲁棒回归是等价的。除此之外,为了设计一个鲁棒的跟踪器,本文从理论上推导了一种最小软阈值均方距离,并据此设计了一个新颖的观测似然函数。最终,本文采用了大量具有挑战性的国际公开视频片段,对本文所有的跟踪算法以及一些经典和前沿跟踪算法进行了综合评估。