论文部分内容阅读
视频目标的提取与跟踪是计算机视觉领域的基本问题,也是智能视频监控系统的关键与核心技术。目前,尽管这方面的研究取得了令人瞩目的进展,但是,由于数据、场景、环境的复杂性,视频目标的提取与跟踪仍是挑战性极大的研究课题。本文围绕上述复杂因素,从低秩和稀疏表示模型的角度出发,对视频目标的提取和跟踪问题展开讨论,分别研究了基于正则化低秩表示模型的视频目标分割、基于加权低秩分解的多模态运动目标检测、基于图像块表达和动态图学习的目标跟踪以及基于协同稀疏表示模型的多模态目标跟踪。在视频目标提取方面,针对视频数据中类内差异性和类间相似性较大,以及视频噪声的存在,提出一种基于正则化低秩表示模型的视频目标分割框架。以超体素为图结点,使用低秩表示模型优化它们之间的相似性关系,可以有效地克服稀疏大噪声和稠密高斯噪声的干扰。为了提高超体素之间的判别性,在稀疏表示模型中引入判别性重复先验对稀疏表示系数矩阵进行正则化,即正则化稀疏表示模型。由于视频数据一般是非常庞大的,因此,提出一种基于次优低秩分解的优化算法高效地求解提出的模型,并在理论上保证了其收敛性。同时,提出流处理方法,使得分割方法能够在有限的计算和存储资源中处理无限长的视频。为了验证有效性,本文分别把优化的超体素的相似性关系应用于无监督的和交互式的视频目标分割任务,均取得了较优的性能。针对场景和环境的复杂性,本文提出了一种基于加权低秩分解的多模态运动目标检测的通用框架。由于可见光谱信息受复杂场景、光照和雾霾等因素的干扰较大,因此,引入热红外光谱信息对其进行补充。具体地,通过为每个模态引入一个质量权重,把不同模态的具有低秩结构的背景数据、多模态共享的稀疏前景模板以及前景、背景像素点的连续性约束进行联合建模,使得能够自适应地融合多模态数据,进而鲁棒地检测运动目标。为了进一步地改善算法检测效率并保持精度,提出一种有效的基于保边滤波的加速算法,使得算法效率达到近实时。此外,构建了一个包括25个视频对的多模态运动目标检测平台,弥补了该领域缺乏标准评价体系的不足,促进相关领域的研究发展。在目标跟踪方面,为了解决基于检测的跟踪框架中的模型漂移问题,本文提出了一种基于图像块的动态图学习方法,消弱目标表达中的背景干扰。首先,把跟踪矩形框划分成不重叠的小图像块,并为每个图像块分配一个权重,用来表示图像块对于目标的重要性。由于传统的8-邻域图忽略了图的全局结构以及局部线性关系,因此,以图像块为图结点,利用它们之间的全局低秩结构、稀疏局部线性关系以及边权的非负性动态地学习图的结构,同时,以半监督的方式联合地优化图像块的权重向量。其次,为了提高跟踪方法的时效性,提出一个实时的优化算法求解提出的模型。最后,把优化的权重向量嵌入到目标跟踪和模型更新中,极大地提高跟踪性能。为了克服场景和环境复杂性带来的挑战,本文在贝叶斯滤波框架下提出了一种基于协同稀疏表示模型的多模态目标跟踪方法。传统的多模态目标跟踪方法把每个模态平等地对待,如果某个模态的信息有非常大的歧义性,则会对最终的跟踪结果造成影响。因此,本文自适应地融合不同的模态,即在稀疏表示模型中为每个模态引入一个质量权重,以此实现稳健地跟踪。特别地,每个模态的权重由该模态的重构误差以及目标与背景的判别性来确定的,并和稀疏表示系数一起联合优化。此外,由于该问题缺少标准的评测平台,因此,构建了一个标准的多模态目标检测平台,包含50个配准的视频对、22个基准方法和2种度量方式。该平台为该问题及相关领域提供了一个标准的评价体系,有助于这方面的研究。