论文部分内容阅读
即使受到全局遮挡、相似物干扰或者光线剧烈变化等复杂外界环境的干扰,人类仍然能够轻松地维持对某一物体的长时间跟踪。然而,现有的机器视觉系统在类似复杂环境下执行实时跟踪任务时往往会发生错跟、跟丢现象,有时甚至跟踪算法会完全失效。因此,如何在实时跟踪的前提下维持跟踪系统的高鲁棒性对于目标跟踪算法来说是一个巨大的困难,也是现阶段研究的主要方向。
提高实时跟踪系统鲁棒性的困难在于物体描述与模式搜索两个主要环节之间的相互制约。低运算量的模式搜寻方法必须基于简单的目标描述,然而这种简单的描述模型又无法完全合适的包含物体外观的全部信息,使得鲁棒跟踪在复杂环境下变得困难。相反,高层次的目标描述方法能灵活的处理外观变化,而这种处理的代价就是复杂的模式搜寻定位算法和高运算量,使跟踪的实时性无法得到保证。
针对现有实时跟踪算法在多种复杂环境下失效的问题,本文主要研究如何构建正确的目标描述模型使其适应性的正确包含物体外观信息,以及如何采取有效减少运算量的方法使得后续模式搜寻步骤快速有效进行,以解决目标跟踪算法中跟踪效率与计算资源之间的矛盾。
首先,本文在第二章探讨了基本mean shift跟踪算法,提出基于一种可变核的mean shift算子以引入物体描述的空间信息,用于解决相似物影响的问题,并在此基础上分析主流跟踪算法在解决跟踪效率与运算资源之间矛盾的不足之处。
其次,论文的第三章讨论了将视觉注意力应用于目标跟踪的重要意义,并详细介绍了视觉注意计算模型。神经心理学研究表明,人类视觉的注意力选择机制能在画面中快速检测感兴趣的物体区域,像过滤器一样从图像的庞大信息量中抽取出有效的信息。因此,第四章研究了引入视觉注意力转移下的遮挡处理算法。该算法利用视觉注意力机制的早期选择和后期转移两个核心过程来保证有限运算量的前提下获取更多关于丢失目标重检测跟踪的有用信息。
论文的第五章以视觉注意力选择计算模型为基础,建立视觉空间注意力和特征空间注意力合作机制下的目标跟踪系统(spatial-feature attentional visualtracking)。其中在建模阶段,视觉空间注意力能从当前帧中提出有限个具有良好定位特征的图像块,而无效或者相对无用的区域被直接摒弃。同时在学习阶段,特征空间注意力能加强那些能够很好的区分目标与背景的特征,忽略那些容易使目标和背景混淆的特征。由注意力合作机制得到的描述模型能极大地减少目标与背景之间的相似混淆性,同时,该模型的维持更新也只需要很小的运算量就能完成。
第六章对论文算法进行实验分析。为了验证算法的有效性,我们设计了16组共127607帧图像的多种复杂场景下视频对本文提出的遮挡算法和跟踪算法进行测试,其中包括镜头快速运动、物体反复长时间遮挡、光线变化强烈以及相似物干扰等各种困难情况。通过将基本mean shift跟踪算法、无参数跟踪算法等在同等条件下得到的实验结果与之进行比较,实验表明本文提出的遮挡算法能很好的处理各类复杂跟踪中出现的遮挡问题。而本文提出的基于注意力合作机制的跟踪算法能很好的解决高运算量和正确跟踪之间矛盾问题,该算法在保证实时性的同时提高了算法的鲁棒性。
最后,我们对全文的工作进行总结,并进一步对视觉信息加工原理进行分析,讨论未来工作中引进基于注意机制的稀疏编码模型可能性。