论文部分内容阅读
近年来,车辆自动驾驶的理论与研究在智能交通领域引起了广泛关注,道路物体检测作为车辆自动驾驶实现的关键环节之一,也得到了迅速的发展。传统的道路物体检测通常综合应用视觉定位、模式识别、图像处理等相关技术以便达到道路物体的2D检测。车辆自动驾驶不但要求更加精确和高效的道路物体检测,还需要得到检测物体的深度信息,以便降低车辆自动驾驶的危险系数。传统的道路物体检测算法无法获得物体的深度信息,因此,考虑到车载相机多为单目摄像机,寻找一种基于单目图像的3D物体检测方案是车辆自动驾驶领域的一个重要研究课题。基于S-SVM(Structures Support Vector Machine,结构化支持向量机)分类器的传统物体检测算法,在过去十几年取得了非常骄人的成绩。大规模训练数据与高性能计算机的迅速发展,使得拥有海量网络模型参数的深度卷积神经网络可以被高效的拟合。本文将传统物体分类算法与深度学习相结合,把S-SVM分类器的优势应用到深度卷积神经网络当中,并取得了非常好的检测效果。本文基于S-SVM分类器对道路目标物体进行粗糙的检测。首先,采用生成3D模板的方法替代流行的SS(Selective Search,选择性搜索)等方法来生成区域候选框,同时通过丢弃先验概率较低的区域候选框来减少区域候选框的数量。其次,本文通过提取区域候选框的特征来构建目标函数,使用S-SVM分类器对输入的特征权值进行训练。最后,基于S-SVM分类器完成对道路目标物体的粗糙检测。本文通过Fast R-CNN把S-SVM分类器的检测结果输入到深度学习中,可以大大提高区域候选框的检测精度。首先,本文对从S-SVM分类器得到的区域候选框进行NMS(Non-maximum suppression,非极大值抑制)操作,然后输入到扩展的Fast R-CNN网络结构中进行训练。本文中Fast R-CNN采用的卷积网络是深度较深的VGG16网络,在VGG16网络的第五个卷积层后,网络结构分为两支,一支计算区域候选框的特征,另外一支计算扩大0.5倍的区域候选框的特征。本文采用多任务损失来预测区域候选框的物体类别,通过回归候选框的尺寸和方向来提高物体检测的精度。为了验证文中使用算法的有效性,本文首先在KITTI数据集上对基于3D模板生成区域候选框的方法进行测试,通过比较各类方法的召回率,进而证明本文生成区域候选框的方法优于SS等优秀算法。然后,将本文采用深度学习得到的检测结果与目前世界上领先的道路物体检测算法进行比较,实验结果显示本文方法可以达到同样甚至更高的识别率,证明本文算法在未来的车辆自动驾驶领域有一定的研究前景。