论文部分内容阅读
视频跟踪是计算机视觉领域的核心问题之一,在媒体制作、医学诊断、智能监控、自动驾驶、互动游戏和军事导航等领域都得到了广泛应用。尽管人们已对视频跟踪进行了广泛而深入地研究,并提出了许多有效的算法,但是在实际应用中视频跟踪仍然面临诸多困难,例如,环境的光照变化、目标姿态的改变、目标形状的非线性变化以及背景中的噪声干扰等。因此,设计能有效克服这些困难的跟踪算法仍然是一项颇具挑战的任务。本文针对目标跟踪中的难点问题,从目标表示和目标搜索两个方面出发,开展了基于多区域联合决策的跟踪算法研究。论文的主要贡献如下:1.提出了一种基于双核的视频目标跟踪方法。对于给定的候选目标,本文通过以下两个评价指标来判断其是否为真实目标:指标一是候选目标与目标模板之间的相似度,指标二是候选目标与其邻近背景区域之间的对比度。我们采用巴氏系数对相似度进行计算,采用延森-香农散度对对比度进行测算,并将两者进行加权组合以形成目标函数。通过对目标函数进行多变量泰勒展开,我们得到其线性逼近式,然后再最大化该逼近式,则推导出一个从当前位置到新位置的双核式目标位移关系式。根据该位移关系式,并使用均值漂移程序,可递归地获得目标在当前帧中的新位置。由于该方法中目标位置是由当前候选区与当前背景共同决定的,因此我们称之为基于双区域联合决策的跟踪方法。2.提出了一种反映人类视觉选择性特性的鉴别性稳定区(Discriminative Stable Region,DSR)检测方法。论文主要讨论了三个相互关联的主题:区域稳定性的数学描述、区域鉴别性的数学定义、鉴别性稳定区的尺寸选择和定位。我们将整个选择过程分为两个阶段:第一阶段从目标图像中提取出突出性区域集,这些区域具有良好的表观稳定性;第二阶段通过一种快速算法从突出区域集中筛选出具有强空间鉴别力的子集作为最终的鉴别性稳定区。通过对多个图像集进行测试表明,鉴别性稳定区在基于重复率和匹配度的评判指标下展现出了较好的性能。3.提出了一种基于鉴别性稳定区的多区域联合跟踪方法。新方法中使用了具有高表观稳定性和强空间鉴别力的DSRs,这使得它能适够应较大的目标表观变化和抵制背景环境中的虚假目标干扰。同时,由于联合了K-均值聚类技术,新方法处理目标遮挡以及运动噪声干扰的能力较强。为了适应更大的目标表观变化,我们还在新方法中嵌入了一种有效的局部表观更新机制,并使用了子空间分析技术来挖掘各DSR与目标之间潜在的仿射关系,从而使得新方法能及时地感知目标形状的变化。由于该方法中目标的位置是由多个DSRs共同决定,因此我们称之为基于多区域联合决策的跟踪方法。对多组复杂视频数据的测试表明,所提出的跟踪方法在处理遮挡、形变、光照变化、相机运动和空间诱惑等方面都展现出较好的性能。