论文部分内容阅读
视频目标跟踪技术是数字图像处理、人工智能等多学科研究的热点之一,其广泛地应用于智能交通、视频监控、人机交互和航空侦察等方面。尽管在目标跟踪领域已经有不少跟踪算法在一定程度上取得了良好的效果,但由于受到复杂背景、目标遮挡、背景光照突变、运动模糊以及跟踪场景杂乱等因素的影响,设计一个鲁棒而高效的目标跟踪算法仍是一项具有挑战性的任务。本文研究了视频目标跟踪中的一些关键问题,从目标观测模型的设计出发,取得以下几方面创新性成果:1.提出了一种鲁棒的广义双向稀疏表示跟踪算法(Bidirectional Sparse Representation Tracker,BSRT)。目前已有的稀疏表示跟踪算法,常见为在目标模板空间上重构候选样本的正向模型,或者在候选样本集上描述目标模板的反向模型,两者均需计算模板集与候选样本集之间的稀疏相关系数矩阵。基于此,本文利用L2范数约束正反向稀疏相关系数矩阵达到一致收敛。在正反向联合稀疏求解下,BSRT算法可以更加充分地挖掘所有候选样本集与模板集之间的稀疏映射关系,从而获得更鲁棒的跟踪结果。此外为了提高算法执行效率,本文采用加速逼近梯度数值解法以矩阵形式推导了BSRT算法的求解框架。矩阵求解表达式使得BSRT算法可以对多个候选样本或模板并行进行稀疏求解,在一定程度上提高了算法的计算效率。实验结果表明,本文提出的BSRT算法比传统的单向稀疏跟踪算法具有更好的鲁棒性。2.提出了一种基于极限学习机的高效判决式目标跟踪算法(Extreme Learning Machine Traker,ELMT)。该判决式跟踪算法充分利用了极限学习机(Extreme Learning Machine,ELM)在分类学习训练方面的显著优势,快速有效地将跟踪目标从背景内容中区分开来。为了利用目标信息在时间和空间上的相关性,ELM分类训练需要满足两个约束条件:(i)成对度量约束,即要求在训练过程中前后帧目标训练样本之间的ELM分类输出要一致收敛,同时需要当前帧目标与背景样本之间的ELM分类输出不一致。(ii)时间平滑约束,指的是ELM分类网络在前后更新中网络结构不能有突变。最后,推导了ELMT算法的在线更新表达式,进一步提高了该算法的在线适应能力。实验结果及讨论,验证了ELMT跟踪算法可以很好地平衡跟踪精度和跟踪效率。3.提出了一种联合流形学习约束稀疏表示和ELM分类判决的目标跟踪算法。该算法充分结合两类跟踪框架的各自优势,实现了一种由粗到细的跟踪过程。具体而言,该算法首先采用本文提出的ELMT跟踪算法建立粗观测模型,将大部分背景样本筛除,仅保留少部分与目标状态相关的候选样本。这样可以减少背景内容对后续跟踪过程带来的干扰和计算负担。接着,本文利用一种基于流形学习约束的稀疏表示跟踪算法作为细观测模型。细观测模型对保留的候选样本进行稀疏重构,从目标外观建模角度以较高的精度确定目标。这里,本文利用ELM分类学习结果构造细观测模型中的流形学习约束项,可实现ELM分类学习和稀疏表示的有机结合。另外在特征提取环节中,该跟踪算法应用了一种新颖的特征提取框架:ELM稀疏自编码器,可以简单而有效地获取输入图像样本的紧致而具有区分性的特征描述,进一步提高了跟踪算法的性能。实验结果与讨论,表明了上述跟踪算法可以充分结合ELM分类学习和稀疏表示的各自优势,取得了比单类跟踪算法更好的跟踪结果。