论文部分内容阅读
目标检测的任务是找出图像中所有感兴趣的目标,并确定它们的位置和类别。在无人驾驶车辆行驶的过程中,快速并准确检测出周围复杂交通场景中的所有潜在危险目标是实现安全驾驶的基础,也是当前无人驾驶技术所需要解决的关键问题之一。本论文结合国家智能网联汽车应用(北方)示范区测试标准中的环境感知模块展开研究,聚焦复杂交通场景下的目标检测技术,以深度学习为研究手段,构建兼顾检测精度与检测速度的车辆前方动态多目标检测模型,主要工作内容如下:1、构建了适用于本文的目标检测模型评价体系。为了探究基于深度学习的目标检测机理,科学评价目标检测模型,本文分析了深度卷积网络的基本工作原理,梳理了目标检测模型的主要评价指标,结合研究内容中所构建模型,对评价指标进行了合理筛选,并确定以同一测试平台下,mAP值结合FPS和Inference Time作为本文所构建模型的评价体系。2、构建了车辆前方动态多目标检测数据集。为了获得适用于本文的数据集,本文分析并拆解了当前主流的目标检测公开数据集,提取BDD100K数据集中适用于本文的图像数据与标签文件。搭建采集平台,实车采集示范区内测试区图像数据,利用LabelImg进行手工标注,构建ICV-DNZ数据集,用以扩充本文目标实例。融合两数据集作为本文的车辆前方动态多目标检测数据集。3、构建了基础多目标检测模型。本文对比分析了两阶段检测代表算法Faster R-CNN与单阶段检测代表算法YOLOv3,确立以YOLOv3作为本文的基础算法,搭建平台,对基础检测模型进行了训练与测试。经测试,基础检测模型的mAP为0.780,在GPU下可稳定在28FPS,Inference Time为30ms,在CPU下可稳定在17FPS,Inference Time为256ms。4、构建了兼顾检测精度与检测速度的多目标检测模型。为了优化基础检测模型在CPU下的检测速度,本文以轻量化模型为优化方向,分析了常见的深度学习模型优化手段,确定以MobileNetV2代替Darknet53作为YOLOv3的骨干网络,以Adam优化代替Momentum优化作为优化模型的优化器,在训练中Batch Normalization的基础上增加Group Normalization用以加速损失收敛。对优化模型进行训练与测试。经测试,优化检测模型的mAP为0.800,在GPU下可稳定在61FPS,Inference Time为19ms,在CPU下可稳定在44FPS,Inference Time为79ms。优化模型在mAP提升0.02的基础上,其参数量较基础模型减小约90%,在CPU下可实现实时检测。5、进行了模型验证的实车试验。为了定性测试所构建模型的性能,本文设计示范区测试与校园内测试两种实车试验场景,并分别进行了实车试验。经试验,本文所设计并优化的车辆前方动态多目标检测模型具有良好的鲁棒性与适用性。