论文部分内容阅读
视频目标跟踪是计算机视觉领域的重要研究分支,在许多领域有着重要的应用。最近,基于学习的跟踪算法逐渐引起相关学者的关注,并取得了较好的跟踪效果。具有代表性的是把跟踪看成目标和背景的分类问题,它不是建立复杂的模型来描述目标,而是找到决策边界来区分目标和背景,当目标外观变化时,该方法只需要更新决策边界而不用更新目标外观模型。目前,基于学习的视频目标跟踪算法典型的有Avidan等人提出的Ensemble Tracking和Toufiq Parag提出的基于boosting自适应线性弱分类器,其主要思想是通过在线训练一组线性弱分类器,并使用颜色、亮度等简单特征来区分目标和背景。但是,针对复杂场景下对目标的跟踪,以上所说的方法可能失去有效性。而本文是在基于boosting的视觉目标跟踪算法的基础上,主要从特征和分类器两个方面进行研究。融入基于核函数的分类器,以及Gaobr滤波和张量等特征。主要研究工作和贡献如下:1)提出了基于Gabor滤波的在线boosting跟踪算法,Gabor滤波因具有优良的空间局部性和方向选择性,能够提取图像局部区域内多个方向的空间频率和局部结构特征,所以对目标和背景具有较好的判别力,但是直接使用高维Gabor特征在跟踪过程中会影响其速度,针对这一问题,本文考虑了如何对Gabor滤波特征进行有效降维,这里拟采用以下两种方案对Gabor特征进行降维并提取最突出的判别特征:(a)使用局部Gabor滤波器;(b)使用自适应的Gabor滤波器组参数。把降维后的Gabor特征同在线boosting的跟踪框架结合起来,来实现对目标的跟踪。2)提出了基于张量特征的在线boosting跟踪算法,张量模式作为传统向量模式的扩展和补充,近年来已引起机器学习、模式识别等领域的广泛关注。张量特征能够提取物体梯度方向的特征,对纹理特征较强的目标具有较好的区分能力。所以,本文把张量特征同在线boosting的跟踪框架结合起来,对纹理特征较强的目标,具有较好的跟踪效果。3)提出了基于最小平方核回归的在线boosting跟踪算法,在复杂的跟踪场景中,线性分类器往往无法提供较好的分类结果,所以,这里使用基于最小平方核回归的分类器来代替线性分类器,其主要思想是:通过使用Mercer核函数,把低维空间线性不可分的模式通过非线性映射到高维特征空间来实现线性可分。为了解决使用核函数分类将会产生较高维数分类器的问题,这里使用在线稀疏算法,通过选取部分样例来训练得到基于最小平方核回归的分类器,然后把最小平方核回归算法同基于boosting的跟踪框架结合起来。实验表明,该方法能够准确的对复杂场景中的目标进行跟踪。特征选取和分类器设计是模式识别领域两个重要的方向,本文从特征和分类器两个方面进行研究,首先,选取一些具有判别力的特征,本文选取Gabor滤波和张量特征,然后,使用基于核函数的分类器代替线性分类器,和传统的算法相比,本算法对复杂的跟踪场景,能够取得较精确的跟踪成果,并且能够达到稳定、实时的跟踪,实验结果验证了该算法的有效性。