论文部分内容阅读
随着摄像头软硬件技术的快速发展,基于视频尤其是高清视频的检测、跟踪、分析系统越来越多,它们在监控等众多领域发挥越来越重要的作用。本文研究的基于车载摄像头的行人跟踪就是其中典型的应用。自动跟踪视频中的行人有许多重要实际应用,例如在机动车上加载摄像头拍摄其前方路况,对道路上的行人进行智能检测与跟踪,在危险的情况下及时进行预警,可以帮助有效避免交通事故的发生。此外在例如自然人机交互接口、医学影像处理、自主机器人、公共场所可疑物体预警等众多领域的应用中还需要跟踪视频中其它物体。为此,本文还研究了一般视频中的物体跟踪问题。在多媒体软硬件在人们日常生活和生产环境中日益快速普及的今天,解决这些问题具有极其巨大的经济社会价值。本文着重研究了两类视频跟踪算法,一类是基于粒子滤波框架多特征融合的生成性方法,一类是基于协同训练和自训练在线更新增量支持向量机超像素分类器和在线随机霍夫森林的区别性方法。开发的跟踪系统与之前有关的算法相比,显著提高了跟踪效果。本文的主要工作和创新包括:针对车载视频中行人的运动和摄像机的运动叠加造成非线性和非高斯性,而行人之间、车辆、路边物体等造成复杂遮挡的问题,提出一种基于粒子滤波框架下的多特征融合视频行人跟踪算法。其中采用了粒子滤波算法通过蒙特卡罗抽样来克服第一个问题,采用一阶自回归动态模型预测目标状态,观测模型自适应加权融合了四种互补性特征(HSV颜色直方图、LBP纹理、HOG形状和运动平滑度),提高了有遮挡时跟踪系统的健壮性。在Caltech大规模数据集上进行了实验,结果证明了本算法在相同精确率时召回率提高20%以上。更一般的视频中的物体跟踪问题,要求将跟踪作为分类问题,同时建模多样化的物体与背景外观。基于在半监督学习中集成多分类器系统的算法框架,本文提出了利用协同训练和自训练在线自适应更新增量支持向量机超像素分类器和在线随机霍夫森林,并将其分类结果融合起来的任意物体跟踪算法。半监督学习充分利用了大量无标注的顺序到达的视频数据来在线自适应更新两种不同算法模型分别采用互补特征的分类器。物体图像表示采用超像素,将前景与背景像素分割开来,降低了后者对分类器中物体模型的干扰。基于mean shift的超像素聚类只需极少的简单标注就能够初始化跟踪系统。在多个视频序列上进行了刚性和非刚性物体跟踪实验,表明本算法的跟踪效果相比之前的多个算法有显著提高。