论文部分内容阅读
计算机视觉一直以来致力于视觉目标的检测、识别、跟踪等问题的解决。目标跟踪是计算机视觉的核心应用点之一,跟踪-学习-检测(Tracking-Learning-Detection,TLD)就是目标跟踪的典型算法之一,TLD算法是一个捷克籍博士生Zdenek Kalal在攻读博士学位期间提出的一种针对新的单目标的长时间跟踪算法。跟踪-学习-检测算法与传统的跟踪算法有着显著的区别,该算法将传统的跟踪算法和传统的检测算法相结合来,协同的解决被跟踪目标在被跟踪过程中发生的形变、部分遮挡等问题。但是该算法过程复杂,计算量庞大,对于普通分辨率的视频,其处理速度仅能达到每秒8-10帧,无法充分达到实时处理的要求,因此采用一种并行的算法对其进行加速十分必要。基于此,本文从以下几点展开了工作:通过对跟踪-学习-检测算法流程的深入研究,本文提出一种将跟踪-学习-检测算法中的学习模块滞后的算法,该算法可以使得跟踪-学习-检测算法的三大核心模块之间能够通过多线程的方式并行处理。有效的提高了CPU利用效率,降低时耗,算法通过三大模块的多线程并行实现了1.3左右的加速比。然后,本文利用GPU硬件,通过CUDA编程对跟踪-学习-检测算法做了并行化处理,跟踪-学习-检测算法包含三个主要的核心模块,即跟踪、检测、学习三大模块,通过对三大模块的时耗进行定量计算,发现检测模块占整个算法大部分时间,因此对检测模块做了CUDA-GPU并行化处理,使得检测模块的加速比达到4倍,整体算法加速比达到3倍。最后,基于传统跟踪-学习-检测算法,本文提出了一种多层的并行的TLD算法,可以解决针对多视觉目标的并行跟踪,同时满足实时性需求。本文的算法首先通过GPU并行计算实现跟踪-学习-检测算法底层检测模块的并行处理,其次提出了一种学习模块滞后方法,改进了跟踪-学习-检测算法各模块的处理流程,从而提高了处理效率,最后采用线程并行实现多目标的并行处理,使得整个系统能够稳定、高效、完善的进行目标跟踪。