论文部分内容阅读
随着物联网和人工智能的迅速发展,自动驾驶技术引起了全球学术界及工业界的广泛关注,其中,道路多目标检测是自动驾驶技术的重要实现技术之一。由于实际交通场景复杂多变,检测的目标通常具有不同的形态、颜色、光亮和遮挡等多变因素,使得基于传统统计学习的道路多目标检测方法早已无法满足自动驾驶的需求,研究高性能的道路多目标检测算法成为迫切且极具挑战的任务。而卷积神经网络具有自适应、自学习和快速处理运算的能力,为道路多目标检测提供了一种新思路。鉴于此,本文立足于卷积神经网络理论,开展基于卷积神经网络的道路多目标检测算法研究,主要研究内容如下:(1)基于Faster Region-based Convolutional Neural Network(Faster R-CNN)的车辆目标检测算法研究。首先设计车辆目标检测系统框架,对Faster R-CNN框架结构及损失函数进行深入研究。然后创建车辆数据集并采用数据增强技术扩大数据集,通过微调Faster R-CNN模型参数,研究网络参数对车辆目标检测性能的影响。实验结果分析表明:Faster R-CNN用于车辆目标检测时存在检测精度低、检测速度慢以及难以检测小目标等问题。(2)针对Faster R-CNN用于车辆目标检测时存在检测精度低、检测速度慢以及难以检测小目标等问题,提出改进Faster R-CNN的车辆目标检测算法。引入Inception结构提取车辆更详细的特征,针对车辆图像背景复杂、目标多变等特点,重新设计锚框尺寸参数,并设计精准车辆区域网络(Accurate Vehicle Region Network,AVRN)和车辆属性学习网络(Vehicle Attribute Learning Network,VALN),将AVRN和VALN模型进行交替优化和联合训练来提高车辆目标检测的速度。实验结果表明,在检测精度和速度方面,改进的Faster R-CNN算法的性能相对于现有的车辆目标检测算法显著提高。与先进的Faster R-CNN检测算法相比,改进的算法检测结果平均准确率(mean Accurate Precision,mAP)增加0.19,检测速度提高三分之一。(3)针对实际交通场景下道路多目标(车辆、行人和骑行的人)检测时对小目标的识别性能低、检测性能差以及检测速度慢等问题,构建了一个基于Faster R-CNN的快速、精确道路多目标检测算法(Fast and Accurate Road Multi-object Detection,FAROD)。FAROD包括一个精确目标建议网络(Accurate Object Proposal Network,AOPN)和一个目标属性学习网络(Object Attribute Learning Network,OALN)。为了提高网络的检测性能,引入反卷积结构,并设计AOPN和OALN网络的损失函数。通过将AOPN和OALN模型进行交替优化、联合训练来加快算法的运算速度。实验结果表明:其测试的平均准确率(mAP)较先进的目标检测算法Faster R-CNN提高0.15,检测速度提高3 fps。