论文部分内容阅读
本文针对无人驾驶环境中的路面障碍目标3D检测问题提出了两种解决方案:基于单目相机的3D目标检测方案与基于单目相机与激光雷达相结合的3D目标检测方案。这两种方案都是在2D目标检测的结果上进行3D包围框的预测。首先,我们以YOLOv3为基础设计了一个2D目标检测网络,并对损失函数进行改进,引入了Io U损失的概念。我们在KITTI数据集对网络进行训练和测试,得到网络对简单、容易、困难三个检测难度目标的m AP分别为0.79、0.67和0.59,且网络完成一次预测的时间只有15 ms,证明了我们设计的2D检测网络在精度与速度两方面可以满足后续的3D目标检测研究。其次,在单目检测算法的设计中,我们以VGG16作为特征提取器,设计了一个可以预测目标局部偏角和尺寸偏差的卷积神经网络,然后通过2D box与3D box间的几何约束来预测出完整的3D box。我们对算法在KITTI数据集上的测试结果进行分析,提出了一种校正网络来帮助网络更准确的定位3D box,最终得到了最大AP值27.3,最快检测速度23 ms的优秀成绩。然后,在单目+激光雷达联合的检测算法的设计中,我们利用相机-雷达投影变换得到2D box对应的感兴趣点云区域,然后基于Point Net设计分割网络去除掉目标以外的杂点后再进行3D box的预测。我们对算法在KITTI数据集上的测试结果进行分析,提出了一种扩张2D box的方法来减少算法对2D检测结果的依赖,最终得到了最大AP值80.36,最快检测速度70 ms的优秀成绩。最后,我们将本文提出的算法与其它同类算法进行比对和分析,可以看出本文算法在速度上具有优势,可以在后续加入目标追踪、避障等算法时依然满足无人车对算法速度的要求。单目3D检测方法与单目激光联合3D检测方法相比,前者精度不足,但胜在结构简单,速度较快,传感器价格便宜,可以在对精度要求不高的情况下应用;后者传感器价格昂贵,普及成本太大,但胜在精度较高,可以在对精度要求较高的情况下应用。