论文部分内容阅读
序列图像为在不同时间、不同方位对目标连续获取的系列图像,广泛存在于视频监控、辅助驾驶、人机交互、军事导航、导弹打击等社会和军事层面。对于图像的有效表示是众多计算机视觉应用(如图像识别、目标跟踪、行为识别等)的基础问题。由于在序列图像中可能出现遮挡、光照变化、形变、背景杂乱等一系列不可预测的变化,对于序列图像中目标的准确表示是一个极富挑战性的研究课题。 稀疏表示理论是最有效的图像表示方法之一。该理论起源于哺乳动物视觉皮层对自然图像刺激的稀疏响应,在人脸识别、目标跟踪、图像去噪、畸变校正等众多领域获得了广泛的应用。本论文针对单个图像样本的稀疏特性,构建了双层次稀疏表示模型,从全局轮廓和局部细节两个层次挖掘稀疏特征以获得更加完备的图像表示;针对多个图像样本中目标物体的组稀疏特性,构建了加权多任务稀疏表示模型,引入的自适应加权机制使得表示模型更具判别性;针对序列图像数据中物体外观的变化特点,构建了序列图像时域与低秩性约束表示模型,有效抵抗序列图像中目标外观的突变干扰。以上三种稀疏表示模型应用于目标跟踪任务,在标准数据集上与当前一些主流的跟踪算法对比,跟踪准确率和鲁棒性均获得了显著提升。 本文的主要工作与创新点如下: 提出了图像双层次稀疏跟踪算法。针对单幅图像表示问题,通过双层次表示模型挖掘其更加完备的稀疏特性,同时结合判别式模型和生成式模型的优点,既能够充分利用背景信息,又能在训练样本较少时保持稳定性能。算法中全局表示字典与分类器进行耦合学习使得模型能够自适应于跟踪过程中场景的变化。通过在15个标准数据集上与10个主流算法进行对比,结果表明本算法在跟踪的平均中心误差和成功率两个指标上均获得了最优的结果,而且能够有效地克服漂移问题。 提出了加权多任务逆向稀疏跟踪算法。针对多个正样本之间存在的组稀疏特性和负样本图像的稀疏特性,将正负样本表示为候选样本的线性组合,构建了统一的多任务稀疏表示模型,并且引入加权机制对正负样本和候选样本之间的关系进行差异化惩罚以提高表示模型的判别性能。相较于传统的多任务稀疏跟踪算法MTT(multi-task tracker),本算法对单帧图像的平均执行时间缩短了42%,平均成功跟踪率提高了46%。与12个当前主流跟踪算法进行对比,本算法在平均性能指标上取得了最优效果。 提出序列图像时域与低秩性约束跟踪算法。针对序列图像中目标外观的变化特点构造表示模型,通过核范数正则化序列目标样本中的低秩结构,同时利用l1,2混合范数合理地对相邻帧中目标样本的差异进行约束。在获得表示模型的编码矩阵后,本算法构建加权编码图以实现更加鲁棒的目标跟踪。实验表明本算法的表示模型能够有效地对序列目标外观中不可预测的突变进行建模。与12个当前主流算法的对比中,本算法在26个标准数据集上取得了最优跟踪结果,在平均中心位置误差和平均跟踪成功率指标上比次优算法分别提高了69%和24%。