论文部分内容阅读
视觉跟踪在计算机视觉中扮演一个重要的角色,有很多应用,如视频监控、机器人运动分析和人机交互。尽管有各种算法提出,但现实的视频序列中存在着复杂物体运动、遮挡、光照变化和杂乱的背景等,这使得视频追踪依然是一个有挑战性的工作。在本文中,我们提出了一个新颖的基于稀疏编码和计数的视觉跟踪法来解决上述问题。由于子空间线性表示下,重建目标有时仍然会存在遮挡或背景杂乱,稀疏约束允许跟踪器有效地克服这些困难的挑战。我们知道,贝叶斯框架已成功应用于选择变量当施加合适的先验。拉普拉斯先验被用来使得线性模型表示更加稀疏,然而它会导致过度惩罚。为了进一步加强系数稀疏性,减少其过度惩罚,我们对每个系数分配一个伯努利变量。在贝叶斯框架下通过执行最大后验概率(MAP)得到我们稀疏编码和计数目标表观模型。该方法被证明是采用L0范数和L,范数的结合来规范增量更新正交字典的系数。为了实现实时追踪,我们提出了一种快速而有效的数值算法来求解该模型。尽管它是一个NP问题,提出的加速近端梯度(APG)法能够保证快速地收敛到问题的解。同时,为了处理追踪漂移,我们提出了一种重新初始化字典方法,它可以在误差超过阈值时更新字典,重新追踪。此外,我们对L0范数和L1范数结合的正则化提出了一个闭解。为了验证我们方法的有效性,我们在遮挡、快速运动、光照变化、姿势和尺度变化、背景混杂等多个视频序列上进行实验,实验结果表明,在多个充满挑战性的视频序列上,我们的方法从速度和质量上都取得了值得称赞的实验结果。