论文部分内容阅读
计算机视觉作为当前的热门领域,其核心内容视频目标跟踪是一个不可忽视的科研重点和难点。已有的视频目标跟踪算法种类繁多、各有所长,但在实际应用中普遍面临着跟踪目标被遮挡、跟踪目标外观尺寸和外界环境突变等问题。本论文重点分析和研究了TLD(Tracking-Learning-Detection)目标跟踪算法,该算法适用于视频图像序列中单目标长时间实时跟踪。TLD目标跟踪算法结合了目标检测和跟踪的思想,将整个系统框架主要划分为跟踪模块、检测模块、学习模块三个部分。其中跟踪模块主要使用LK(Lucas-Kanade)光流法对跟踪目标在后一帧的位置进行预测。检测模块针对后一帧进行全局扫描和级联分类以确定跟踪目标在后一帧中可能出现的位置。学习模块运用P-N学习机制学习跟踪模块、检测模块的结果以更新检测模块中的级联分类器,提高TLD目标跟踪算法的鲁棒性和稳定性。此外,综合部分综合跟踪模块和检测模块的结果决策出跟踪目标在当前帧的最终位置。本论文在TLD目标跟踪算法的基础上,针对跟踪目标的遮挡和尺度变化问题对TLD目标跟踪算法进行改进。针对跟踪模块提出了一种角点检测和均匀取点相结合的选取跟踪点的方法,充分考虑了跟踪目标的完整性和背景信息带来的干扰,将跟踪目标划分为基本无背景信息的主体部分和带有背景信息的边缘部分,对跟踪目标的主体部分采用均匀选取跟踪点的方法得到一定数量的稳定均匀跟踪点,对跟踪目标的边缘部分采用角点检测的方法得到不定量的可靠角点跟踪点。这种角点检测和均匀取点相结合的选取跟踪点的方法既保证了选取的跟踪点的数量,避免了后续LK光流法跟踪时无点可用的局面,又一定程度上改善了跟踪点的质量,提高了后续LK光流法跟踪成功的概率,进一步提高了TLD目标跟踪算法跟踪模块的鲁棒性和稳定性。为了弥补上述选取跟踪点的方法增加的计算量,在检测模块之前增加了马尔科夫预测器,利用马尔科夫预测器和归一化互相关预测器的结果决策出检测模块的扫描范围,并加入了跟踪目标的运动补偿机制,相比于原来的全局扫描大大降低了计算量。针对检测模块提出了一种相似尺度等级优先的扫描方法,通常情况下相邻两帧视频图像之间跟踪目标不会出现剧烈形变,因此优先使用和当前帧目标限定框大小相似程度最高的三个尺度等级的滑动窗口对后一帧视频图像进行扫描和分类,检测模块根据分类器分类的结果决策出后一帧中跟踪目标的位置。相比于原来滑动窗口按照尺度等级从小到大的扫描方法,相似尺度等级优先的扫描方法降低了检测模块的计算量,进一步提高了TLD目标跟踪算法的实时性。