论文部分内容阅读
目标检测即从输入的信息中检测出感兴趣的目标。目标检测算法能否准确及时地检测出目标是评判目标检测算法优劣的重要指标。随着深度学习技术的不断发展,基于深度卷积神经网络的目标检测算法,在人工智能和信息技术等众多领域都有广泛的应用。本文将基于深度学习的目标检测算法应用于路面多类目标检测,主要从以下几个方面展开研究:(1)针对当前多类目标检测领域存在数据集不完整的问题,本文在分析公开目标检测数据集的基础上,结合TT100K数据集和采集的图像数据,使用数据标注软件对样本数据中目标信息进行标注。最后制作完成了一个包含路面上机动车、非机动车、行人和部分类别交通标志的多目标标注信息的数据集。该数据集共包含图像数据17580张,标注138851个目标实例。(2)针对多类目标同时检测时各类目标尺度不一,导致目标检测整体效果不佳的问题,本文通过改进聚类算法,选取更加适合多类目标同时检测的目标检测设定框。借鉴基于密度聚类的理念,本文重新设计了K-means聚类算法的距离公式。距离公式的设计充分考虑了聚类中心邻近数据的密度对聚类结果的影响,将聚类中心邻近数据的密度输入到距离公式中,作为相似性指标度量聚类的效果,解决了K-means聚类算法易受噪声影响的缺陷和样本框中样本不均匀导致的聚类效果不佳的问题。通过目标检测对比实验发现,改进的K-means聚类算法获得的目标检测设定框在目标检测中能够较好地反映目标检测框的分布情况,并在目标检测中具有很好的适配性,获得了更高的目标检测平均精度。(3)针对路面多类目标同时检测时样本不均衡,导致小目标检测效果不佳的问题,本文选取单阶段目标检测算法YOLO V3为研究基础,分别从网络模型的损失函数和网络结构图入手,对YOLO V3目标检测算法进行改进。首先引入Focal Loss损失函数代替原YOLO V3算法中预测框定位平方和损失函数、置信度交叉熵损失函数及类别概率交叉熵损失函数,加快了初始收敛速度,减小了梯度消失的影响,提高了小目标检测的平均精度。接着在原YOLO V3算法网络模型的基础上,将4倍下采样获得的特征图与52×52尺度特征图卷积运算再2倍上采样后得到的特征图融合,获得了拥有更高细粒度的特征图。通过增加一个用于小目标检测的104×104尺度的目标检测模块,提升了神经网络对小目标的检测能力。(4)将改进的YOLO V3算法在自制的路面多类目标检测数据集上进行训练和测试,并完成了YOLO V3算法改进前后目标检测的对比实验和改进后的YOLO V3算法与其他目标检测算法的对比实验。实验结果表明,改进的YOLO V3算法在自制数据集上进行多类目标检测的平均精度都高于其他目标检测算法,平均精度达78.17%,较未改进的YOLO V3算法提高了3.81个百分点,检测速度也达到了46.23帧每秒,满足实时检测的要求。