论文部分内容阅读
近年来,随着人工智能技术的快速发展,全球的各大科技公司都将目光战略性地转移到了自动驾驶领域,一时将自动驾驶的研究推向了高潮。目标检测是自动驾驶领域的核心技术之一,它是自动驾驶感知环境的重要途径,影响着车辆的控制决策。行人、车辆、非机动车是车辆驾驶过程重点关注的对象,为此,本文根据KITTI自动驾驶数据集,将检测对象合并为汽车、行人、骑行的人三类目标,并在此基础上设计适用于自动驾驶目标检测的方法。自动驾驶目标检测环境极其复杂,存在目标尺度变化较大、目标密集以及遮挡严重等问题,传统的目标检测方法难以达到检测精度的要求。因此,本文选择基于深度学习的二阶段目标检测算法Faster R-CNN和一阶段目标检测算法SSD(Single Shot Multibox Detector),结合实验场景和算法自身特点分别对两种算法进行改进,并通过实验验证改进前后的算法性能。对于二阶段目标检测算法Faster R-CNN,根据数据集的分辨率调整了网络的输入;采用ROI Align改进了原算法中高误差的ROI Pooling候选区域池化方式;采用Focal Loss对损失函数的分类部分进行优化,使训练过程更加关注困难样本;将检测框的后处理算法改进为柔和的非极大值抑制算法(Soft Non-Maximum Suppression,Soft NMS),得到基于改进Faster R-CNN的自动驾驶目标检测算法。改进后的算法较原算法在测试集上的平均检测精度均值(mean Average Precision,m AP)从0.682提升到了0.833,但检测速度仅为9fps。对于一阶段目标检测算法SSD,考虑数据集的宽高比对网络的输入进行了调整;基于特征图金字塔网络(Feature Pyramid Networks,FPN)对SSD基础网络进行改进,通过多尺度特征融合使得低层特征的语义信息充分表达;在基础网络中应用可调制变形卷积提高对不规则目标的特征提取能力;采用GHM(Gradient Harmonizing Mechanism)损失函数改进了原算法中的分类损失和检测框位置损失,得到基于改进SSD的自动驾驶目标检测算法。改进后的算法在测试集上的m AP从原算法的0.65提升到了0.818,同时检测速度达到了29fps。改进后的SSD和Faster R-CNN在检测精度上均得到较大提升,达到了相近的检测精度,但在检测速度上,改进后的SSD远超过后者,达到了实时性,更适用于自动驾驶目标检测的场景。