论文部分内容阅读
视觉目标跟踪是视频内容分析与理解的基础,在安防、军事、人机交互、智能设备等领域具有广泛的应用。提高跟踪算法的准确率与鲁棒性,能够为各领域发展提供必要的技术支撑,具有重要的研究意义与实用价值。尽管近年来已取得了显著的进展,在线目标跟踪的研究目前仍面临目标形变、复杂运动、背景噪声干扰等挑战性因素的困扰。当前最先进方法使用的目标表征方式侧重于全局目标结构的建模,适用于跟踪形状结构稳定的刚性物体,而对于目标形变明显的情况,该类模型适应目标形变的能力受到严格的全局性几何约束的限制,在建模目标运动与表观变化规律方面存在固有的局限性,难以获得稳定准确的跟踪效果。针对上述问题,本文着手于研究更为普适的目标表征模型以及相应的跟踪方法,重点处理多重因素引起的目标形变以及带来的表观建模难题。本文主要工作如下:
在目标表征方面,提出了一种能够有效表征可形变物体的像素级目标概率模型。首先,将跟踪问题形式化为一个像素级最大后验估计问题,联合考虑像素层面的时域一致性约束与表观模型。提出基于像素匹配的时域一致性模型,根据光流校验误差定义概率转移函数,以估计不同帧之间的一致性信息,集成利用历史估计结果。该模型能够减小单帧表观模型误差产生的影响,使得方法具有较好的普适性。进一步提出了从像素级概率高效生成传统模型判别分数的方法,从而产生了一种多表征融合跟踪框架,使得基于传统模型的算法能够集成像素级判别信息。实验表明,所提出的方法在跟踪高度可形变物体方面优于最新方法,并且多表征模型在通用物体跟踪任务中显著提升了传统方法的总体性能。
针对平台与目标复杂运动耦合带来的目标形状与表观变化问题,提出基于目标–背景运动关联建模的像素级概率推断方法。首先,从成像角度分析运动与图像观测的关系,减小运动估计的参数空间来保证方法的实时性;其次,提出先局部后全局的光流估计方法,获得保留物体边缘的目标邻域光流场;进一步,在贝叶斯理论框架下,引入像素空间隐变量表示像素点属于目标的概率,引入运动参数空间隐变量来表示目标与相机运动状态,将跟踪任务建模为交替估计这些隐变量的过程。在时域上,分别考虑其当前状态估计与历史估计结果的关系,利用时域上的一致性约束来保证状态分布预测的可靠性,从而实现问题的迭代求解,实现运动参数解耦并获得准确的像素级目标概率估计。实验表明,提出的模型显著提高了算法对成像平台与目标复杂运动的鲁棒性。
为处理目标形变引起的表观模型受背景区域干扰的问题,将目标邻域的显著性估计问题引入到视觉跟踪任务中,进行两个问题的联合建模。一方面,根据跟踪场景中存在历史信息的特点,提出一种新颖的时空显著性计算方法,在时间域上建立基于光流法的显著性转移模型,在空间域上建立基于背景距离与在线学习的像素级判别模型,集成时空观测进行联合推理。另一方面,引入显著性作为可靠性权重来描述目标表征模型中视觉特征的重要性,使得算法的目标表征更为精确,能够有效抑制复杂背景噪声对模型的干扰,对目标形变因素的鲁棒性得到提升。实验表明,该方法对于存在多重因素干扰的长时间跟踪任务具有突出的可靠性。
在目标表征方面,提出了一种能够有效表征可形变物体的像素级目标概率模型。首先,将跟踪问题形式化为一个像素级最大后验估计问题,联合考虑像素层面的时域一致性约束与表观模型。提出基于像素匹配的时域一致性模型,根据光流校验误差定义概率转移函数,以估计不同帧之间的一致性信息,集成利用历史估计结果。该模型能够减小单帧表观模型误差产生的影响,使得方法具有较好的普适性。进一步提出了从像素级概率高效生成传统模型判别分数的方法,从而产生了一种多表征融合跟踪框架,使得基于传统模型的算法能够集成像素级判别信息。实验表明,所提出的方法在跟踪高度可形变物体方面优于最新方法,并且多表征模型在通用物体跟踪任务中显著提升了传统方法的总体性能。
针对平台与目标复杂运动耦合带来的目标形状与表观变化问题,提出基于目标–背景运动关联建模的像素级概率推断方法。首先,从成像角度分析运动与图像观测的关系,减小运动估计的参数空间来保证方法的实时性;其次,提出先局部后全局的光流估计方法,获得保留物体边缘的目标邻域光流场;进一步,在贝叶斯理论框架下,引入像素空间隐变量表示像素点属于目标的概率,引入运动参数空间隐变量来表示目标与相机运动状态,将跟踪任务建模为交替估计这些隐变量的过程。在时域上,分别考虑其当前状态估计与历史估计结果的关系,利用时域上的一致性约束来保证状态分布预测的可靠性,从而实现问题的迭代求解,实现运动参数解耦并获得准确的像素级目标概率估计。实验表明,提出的模型显著提高了算法对成像平台与目标复杂运动的鲁棒性。
为处理目标形变引起的表观模型受背景区域干扰的问题,将目标邻域的显著性估计问题引入到视觉跟踪任务中,进行两个问题的联合建模。一方面,根据跟踪场景中存在历史信息的特点,提出一种新颖的时空显著性计算方法,在时间域上建立基于光流法的显著性转移模型,在空间域上建立基于背景距离与在线学习的像素级判别模型,集成时空观测进行联合推理。另一方面,引入显著性作为可靠性权重来描述目标表征模型中视觉特征的重要性,使得算法的目标表征更为精确,能够有效抑制复杂背景噪声对模型的干扰,对目标形变因素的鲁棒性得到提升。实验表明,该方法对于存在多重因素干扰的长时间跟踪任务具有突出的可靠性。