论文部分内容阅读
随着视频监控的日益普及,海量的视频数据成为大数据应用的重要非结构性数据来源。自动地检测运动目标是大规模视频监控的重要研究课题,对后续的模式识别和行为分析有着重要意义。运动目标检测被广泛应用于人机交互、行人及交通等场景中,但由于目标尺度不一致、复杂背景干扰、光照变化等因素往往造成漏检率和误检率高而阻碍应用的推广。针对以上问题,SVM、Faster RCNN、SSD等更鲁棒的算法被提出,但应用环境复杂性使得这些算法仍然面临着性能瓶颈。林区道路场景下木材运输车辆的检测是复杂场景下运动目标检测的典型案例,具有目标多样性,尺度不一致,背景复杂和光照变化等特点。本文提出的算法除了在公共数据集上进行实验评估外,都以林区道路的木材运输车辆的检测作为更严苛的应用场景进行实验及验证。本文提出利用目标特征在视频上下文背景下所具有的较强相关性,使算法获得对复杂背景和光照变化的适应性,并通过网络模型结构自适应木材运输车辆尺度来提升算法的尺度适应能力。本文具体研究内容和创新点如下:(1)运动车辆背景建模。Vi Be算法具有运算效率高,易于实现等优点,但易受“鬼影”、静止目标等影响。本文将Vi Be算法与带颜色恢复的多尺度视网膜增强算法(MSRCR,Multi-Scale Retinex with Color Restoration)结合,即Vi Be-M算法,该算法进一步消除了“鬼影”,提高了复杂背景和光照变化下的检测准确率。(2)基于上下文的SSD目标检测。本文重点研究了单点多尺度目标检测器(SSD,Single Shot Multi Box Detector)及均值平均精度(m AP,mean Average Precision)与特征映射(feature map)数的关系,构建了基于SSD的DRF(Detection with Refined Feature)目标检测,该检测器增加了中心映射(center map)和尺度映射(scale map),融合了每层网络结构产生的特征信息,丰富了运动目标的上下文信息。与已有算法相比,提出的方法显著提高了在Pascal VOC公共数据集上的目标分类置信度和定位准确度。此外,本文将基于SSD的DRF目标检测与广义交并比(GIo U,Generalized Intersection over Union)结合来检测木材运输车辆,解决了预测框与真实框不相交时无法优化m AP的情况。(3)基于自适应上下文的木材运输车辆检测。本文主要讨论了Faster RCNN、YOLOv3和YOLOv3-tiny算法的优缺点,采用tiny网络结构来适应木材运输车辆的尺度大小,通过获取目标上下文的特征信息,确定包含目标的区域,把该区域送入卷积网络中进行检测,降低了复杂场景和光照变化下木材运输车辆的误检漏检率,进一步提高了目标检测的准确性。