论文部分内容阅读
计算机视觉作为一个十分前沿而又活跃的研究领域,已经发展为人工智能最重要的分支之一。基于视觉的目标检测算法已经在各个领域得到应用,比如智能视频分析系统,工业智能制造系统,智慧城市交通系统,自动驾驶等领域。本文主要针对交通场景的目标检测算法展开研究,期望深度学习目标检测算法能够促进自动驾驶感知技术快速发展。首先,论文归纳并总结了经典的目标检测算法和现在基于卷积神经网络的目标检测算法,详细地分析了两类算法性能的差异和适用场景。对基于深度学习的目标检测算法的研究现状做了客观的总结,并对未来的发展趋势做了展望。其次,为了满足交通场景对目标检测算法的精度和速度的需求,论文选取快速的单阶段目标检测算法SSD(Single Shot Multi Box Detector,SSD)进行研究。针对SSD对困难小目标的检测性能差的问题,提出了一种深度特征融合算法DFSSD(Deep Fusion based Single Shot MultiBox Detector,DFSSD),提升了SSD检测困难小目标的精度。在PASCAL VOC2007测试集上,DFSSD比原始SSD300的m Ap(mean Average Precision,m AP)增加了3.7%。在KITTI数据集上,针对中等困难目标和困难目标,DFSSD比原始SSD300的m Ap分别增加了2%和5%。再次,为了抑制DFSSD算法因融合而产生冗余的特征,防止模型不能把注意力放在关键特征上,论文又引入目前比较流行的注意力机制,即卷积块注意力模块CBAM(Convolutional Block Attention Module,CBAM)。改进CBAM模块并将其用于DFSSD算法中,设计了DFSSDCBAM目标检测算法,提高了深度特征融合的效率,从而进一步提高算法的预测精度。在PASCAL VOC2007测试集上,DFSSD-CBAM比DFSSD的m AP增加了2.1%。最后,为了降低模型的参数量,使其能够部署到交通场景中硬件资源有限的移动平台上,论文又详细地研究了三个轻量级模型的设计原理,并对Mobilenet V2算法进行改进,使其作为DFSSD的主干网络,在此基础之上,设计了一个轻量级模型E-Mobilessd。E-Mobilessd在没有损失过多精度的情况下,减少了大量的参数。E-Mobilessd的参数量大约只有原始SSD的四分之一,有效地降低了模型对内存的消耗量,具有实时检测的性能。