论文部分内容阅读
目标跟踪在目标运动的视觉分析中占有重要的地位,属于视觉的中层部分。利用目标的跟踪,可以方便地获得目标的运动、姿态、行为参数,为后续的高层的行为理解和识别奠定了基础。目标跟踪虽然是计算机视觉领域一个重要的研究方向和研究热点,但是目前仍然有很多理论与技术问题有待解决,特别是跟踪过程中噪音干扰、运动模糊、光照变化、遮挡等复杂问题的解决。轨迹模式学习在目标运动的视觉分析中属于高层部分。它可以简单地被认为是对时变轨迹数据进行无监督学习,从而得到一系列具有代表性的轨迹模式。而轨迹模式检索则是将查询序列与预先学习好的检索模型进行相似度计算,从而得到与查询序列相匹配的轨迹模式。由此可见,轨迹模式学习和检索的关键问题是如何从学习样本中获取代表性的轨迹模式以及如何对轨迹模式进行有效的建模。
本文的工作以在视觉监控场景下目标鲁棒跟踪和轨迹模式学习为目标,分别在下面两个问题上进行了深入的探讨和分析:(1)基于目标表观建模的视觉跟踪;(2)目标轨迹模式学习和检索。大量的实验表明我们方法的有效性和鲁棒性。论文的主要工作和贡献如下:
①提出了基于增量张量子空间学习的目标跟踪框架。该框架利用增量张量子空间学习方法来对目标进行表观建模。这样以来,它不仅能够有效地减少目标区域像素的时空冗余信息,而且也能够融合不同角度的时空信息,从而对噪音、运动模糊、光照变化等复杂因素非常鲁棒。另外,还提出了基于张量子空间学习的前景分割框架。该框架利用基于张量子空间学习的方法来在线地构建一个基于张量特征空间的背景模型。该背景模型能够有效地刻画场景像素之间的时空分布信息,从而得到了鲁棒的前景分割结果。
②提出了两个基于对数欧氏黎曼子空间学习的表观模型。这两个表观模型能够充分地考虑目标表观的时空自相关信息,从而有效地解决了在复杂因素影响下目标鲁棒跟踪的问题。具体的说,第一个表观模型首先提取一些图像特征(包括像素灰度值、一阶梯度以及二阶梯度等):然后对这些特征进行自相关分析,也就是计算这些特征对应的协方差矩阵;接着将协方差矩阵映射到对数欧氏黎曼空间;最后在对数欧氏黎曼空间进行线性子空间分析,从而得到基于对数欧氏黎曼特征空间的表观模型。第二个表观模型是在第一个表观模型的基础上进行了表观分块和空间加权,从而考虑了目标表观的局部空间互动信息。另外,增量对数欧氏黎曼子空间学习方法被用来在线地更新这两个表观模型,从而使得它们能够适应外界条件的变化。
③提出了一个基于热核子空间学习的目标跟踪框架。在该框架中,增量热核子空间分析算法被用来在线地学习一个多尺度的目标表观热核特征空间模型。另外,增量2DPCA被用来在线地发现多尺度热核的投影子空间,从而能够以较低的代价来适应环境的变化。
④提出了基于主导集图聚类的轨迹模式学习框架和基于狄利克雷混合模型的轨迹检索框架。在基于主导集图聚类的轨迹模式学习框架中,轨迹重采样位置特征和轨迹方向直方图特征被提取。这两种特征分别能够有效地刻画目标运动的时空位置和方向信息。接着,这两种特征分别被主导集图聚类方法进行轨迹粗聚类和轨迹精聚类,从而得到了最终的轨迹模式。此外,又提出了基于狄利克雷混合模型的轨迹检索框架,该框架使用DPMM和tDPMM分别进行轨迹模式学习和轨迹模式建模。其中,DPMM具有较强的轨迹模式类别数目预测能力,并且能够进行较稳定的轨迹模式学习,从而为轨迹检索框架提供了扎实的底层数据支持。而tDPMM能够有效地建模轨迹的局部时空特性,从而使检索框架具有完全轨迹检索和部分轨迹检索双重能力。另外,还提出了一种新颖的分层狄利克雷马尔科夫模型(也是一种分层贝叶斯产生式模型),该模型能够将轨迹模式学习和轨迹模式建模这两步有效地合并成一步。也就是说,我们在学习分层狄利克雷马尔科夫模型的过程中,同时也完成了轨迹模式学习和轨迹模式建模这两个任务。