论文部分内容阅读
视觉跟踪课题是当今计算机视觉领域中相当热门的研究方向之一,也是一门融合了模式识别、图像处理、图像表示、人工智能、信号处理等综合性学科,它在智能监控、智能交通、人机智能交互以及军事打击等领域都有着广泛且重要的实际应用价值。因此,视觉跟踪课题一直广受国内外学者的关注,并对此有着深入的研究。但视觉跟踪却由于其的特殊性与复杂性,跟踪场景中复杂多变,容易受到外界的干扰,使得跟踪的运动目标产生变化,这也是视觉跟踪面临和要解决的主要问题。因此,如何针对变化的目标构建有效的表观模型,如何通过优化算法提高跟踪的实时性,一直是视觉跟踪方面研究的重点与难点。 近些年稀疏表示理论从信号处理领域逐渐被应用到视觉追踪领域,特别是2004年压缩感知理论的提出,更加扩大了稀疏表示在视觉追踪领域的应用。虽然基于稀疏表示的视觉追踪能一定程度上较好的应对光照和部分遮挡的影响,然而其算法复杂度高,实时性比较差,并且在目标发生较大姿态变化以及严重遮挡时,跟踪效果不尽人意。本文主要学习与研究了稀疏表示以及压缩感知理论知识,并将其应用于视觉跟踪领域,针对稀疏表示目标跟踪的经典算法——L1 Tracker以及CT算法的优点与不足,提出了基于正反向稀疏表示的运动目标跟踪算法: 首先,通过压缩感知理论,设计观测矩阵,对目标的特征进行压缩投影,并根据特征特点进行多特征融合。 其次,根据目标与背景存在的空间上下文位置关系,在模版中加入了背景模版特征,构建融合了背景上下文信息的目标过完备字典。 再次,针对简化的采样运动模型,在采样过程中不具备方向性,需要通过大量采样来保证目标跟踪的准确性问题,改进了稀疏表示,使用反向稀疏表示来筛选采样粒子,达到初步定位,再次精确采样,通过正向稀疏观测目标。 最后,结合稀疏表示重构过程的实际情况,使用了块正交匹配追踪(BOMP)算法加速稀疏表示重构,提高了跟踪的速度。 通过大量实验设计与验证,表明了我们提出的基于正反向稀疏表示的目标跟踪算法在标准视频帧中能够有效的应对光照、遮挡、旋转等各种干扰因素,并且在跟踪精度、稳定性以及速度方面得到较高的提升。