论文部分内容阅读
目标检测可以辅助智能车辆完成环境感知、驾驶导航与安全驾驶等任务,是智能车辆视觉辅助系统中不可缺少的组成部分。随着深度学习的发展与进步,目标检测利用深度卷积神经网络技术突破了多年来的瓶颈,检测准确率得到了大幅度的提高。相比于人工设计特征,深度卷积神经网络能够自动学习和提取图像中目标的特征,并且更具有区分力和表征能力。然而,基于深度卷积神经网络的目标检测算法实时性制约于感兴趣区域数量,感兴趣区域中大量的背景区域既增加检测耗时也提高了误检率。同时,卷积神经网络通常将最后一层卷积特征作为分类依据。由于图像输入卷积神经网络后会进行多次采样和卷积,造成一定程度的信息流失,会影响最终的检测精度。因此本文针对感兴趣区域优化和深度卷积神经网络结构优化展开研究,并将算法用于行人检测和车辆检测,论文的主要工作和成果为:1.为了解决感兴趣区域中背景区域过多的问题,提出了基于Deepbox预分类的目标检测算法。针对目标检测算法流程的三个步骤:感兴趣区域提取、特征提取和目标分类,在感兴趣区域提取和特征提取两个阶段之间增加预分类阶段,预分类主要思想是排除感兴趣区域提取过程中产生的大量背景区域,尽可能保留目标区域,提高感兴趣区域的召回率,大幅度降低输入检测网络的感兴趣区域总数。感兴趣区域的数量直接影响着目标检测的总耗时,减少感兴趣区域的总数有助于提高目标算法的实时性。在降低感兴趣区域数量的同时提高召回率,能够在一定程度上保证算法的检测准确率。该算法在Pascal VOC2007数据库中进行实验检测,并与主流算法进行对比,证明了该算法能够有效的降低检测耗时并维持较高的检测准确率。2.为了解决图像经多次卷积和降采样信息流失的问题,提出了基于多层区域特征融合的FusionCNN目标检测算法。该算法能够将多层卷积层的目标区域特征进行融合,增强了分类特征的区分能力,能够提高检测准确率。该算法对于提高图像中小型和中型尺寸目标的检测准确率效果显著,主要原因在于最后一层卷积图上中小型目标区域太小,相比于大型目标信息流失更严重,多层信息的融合能够在一定程度上改善这一问题。该算法在第二章的基础继续在Pascal VOC2007数据库上进行实验,实验结果证明了该算法能够有效提高目标检测准确率,特别是行人检测和车辆检测。3.针对无人驾驶车辆目标检测需求,将Deepbox算法和FusionCNN算法进行组合,在实车图像数据中进行行人检测和车辆检测实验。根据实车图像数据特性调整了FusionCNN的网络结构与参数。在实验中,与ACF算法和Fast-rcnn算法进行了对比,证明了本文算法能够在有效降低检测耗时的同时提高检测准确率。