论文部分内容阅读
随着以深度学习核心技术的第三波人工智能技术发展的浪潮在近些年来的突破性进展和自动驾驶不断向商用化推进,对自动驾驶车辆的目标检测系统的要求也在不断提高。无人驾驶汽车的自动驾驶引擎要通过摄像头和激光雷达等传感器收集的环境信息做出控制决策。因此,自动驾驶场景下对目标检测的精度和实时性有非常高的要求,因为在此场景下高延迟会带来非常严重的后果。卷积神经网络在图像识别上的出色表现自然被引入到计算机视觉的目标检测任务当中。近年来目标检测算法的发展不断推陈出新,速度上越来越快,精度上越来越高。目标检测算法的发展可以总结为两条线:以R-CNN系列为代表的Two-Stage算法和以YOLO为开山之作的One-Stage算法。本文的主要工作是研究了自动驾驶领域的车辆目标检测算法,然后针对自动驾驶场景下以往的目标价测模型在效率上达不到落地应用要求的问题,提出了通过使用轻量化卷积神经网络优化目标检测算法的性能的解决方案。效率问题既体现在模型的存储问题,也体现在检测速度问题。本文的第一个工作是基于YOLOv3目标检测算法,使用轻量化卷积神经网络MobileNet V2对其骨干网络进行优化,本文重新设计了一个My MobileNet V2-YOLO V3的网络结构。基于深度学习的神经网络模型,几乎全部可以通过调整超参数的策略来使得在该数据集上出现过拟合,也就是往往在实验室环境下表现良好的算法模型在真正运用于自动驾驶技术的时候反倒会出现各种不足。因此,第3章这里还使用DCGAN对原有数据集进行扩充。本文的第二个工作是提出了基于轻量化卷积神经网络ShuffleNet的YOLO v3车辆目标检测算法,ShuffleNet是探索一个可以满足受限的条件的高效基础架构,提出了逐点群卷积(pointwise group convolution)帮助降低1×1卷积带来的计算复杂度。但是使用逐点群卷积会有“信息不通畅的问题”存在,ShuffleNet网络中提出通道混洗(channel shuffle)来帮助信息流通。ShuffleNet v1版本中使用了过多的1x1卷积,而且群卷积的过多使用会增加MAC,因此设计了自己的ShuffleNet Unit的模块对此问题进行了优化处理。最后,给出本文提出的两种优化算法在数据集上的实验结果并与已有的车辆目标检测算法进行了比较,得出基于轻量化卷积神经网络对车辆目标检测算法进行优化后在检测精度没有相差很多的情况下提升了网络的检测速度。