论文部分内容阅读
本文以视频目标跟踪为研究重点,着重研究和分析了目标跟踪算法中以TLD(tracking—learning—detection)为系统框架的算法。TLD只需要较少的先验信息就可以实现对目标的长期在线跟踪。基于TLD的目标跟踪系统主要由4个部分组成:跟踪模块、检测模块、综合模块和学习模块。跟踪模块利用金字塔LK光流法预测出跟踪目标在当前帧中的位置信息。检测模块检测当前帧中的全部的扫描子窗口,检测到目标可能出现的一个或者多个位置。综合处理模块根据跟踪结果和检测结果给出当前帧中是否存在目标以及目标的位置等信息。学习模块对检测结果、综合输出结果和跟踪结果进行学习,从而完成对检测模块和跟踪模块的更新,对于提高目标的长期在线跟踪的综合性能方面非常有效。TLD目标跟踪算法虽然实现了对目标的长期的较为准确的跟踪,但是在实际的应用环境中其稳定性、适应性和实时性等方面还存在着很多问题。本文针对这些问题提出了一些改进的算法。首先在TLD的跟踪模块中设计了最近邻的中值流跟踪算法,主要对其目标边界框的选择进行改进、对跟踪到的边界框进行重新的聚类和设计了基于中值的边界框定位算法来重新确定跟踪器最后输出的目标边界框,与原始TLD中跟踪器所采用的选用单一的边界框进行跟踪相比较,不仅增强了对目标遮挡和光照干扰的鲁棒性,而且也提高了跟踪目标的精度;其次,针对TLD算法中检测模块需要检测所有的子窗口带来的算法处理速度较低的问题,利用Kalman滤波器估计出目标在当前帧中的大致出现区域,将这个大致的区域作为TLD的目标检测区域,虽然对TLD跟踪算法的跟踪精度有一定程度的降低但是却对TLD算法的处理速度有一定的提升;最后,针对TLD算法对类似目标出现跟踪效果不佳问题,对TLD的综合模块进行改进,重新设计了算法流程,从而提高了TLD对相似目标的跟踪精度。