基于深度学习的路面多类目标检测问题研究

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:Konca
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测即从输入的信息中检测出感兴趣的目标。目标检测算法能否准确及时地检测出目标是评判目标检测算法优劣的重要指标。随着深度学习技术的不断发展,基于深度卷积神经网络的目标检测算法,在人工智能和信息技术等众多领域都有广泛的应用。本文将基于深度学习的目标检测算法应用于路面多类目标检测,主要从以下几个方面展开研究:(1)针对当前多类目标检测领域存在数据集不完整的问题,本文在分析公开目标检测数据集的基础上,结合TT100K数据集和采集的图像数据,使用数据标注软件对样本数据中目标信息进行标注。最后制作完成了一个包含路面上机动车、非机动车、行人和部分类别交通标志的多目标标注信息的数据集。该数据集共包含图像数据17580张,标注138851个目标实例。(2)针对多类目标同时检测时各类目标尺度不一,导致目标检测整体效果不佳的问题,本文通过改进聚类算法,选取更加适合多类目标同时检测的目标检测设定框。借鉴基于密度聚类的理念,本文重新设计了K-means聚类算法的距离公式。距离公式的设计充分考虑了聚类中心邻近数据的密度对聚类结果的影响,将聚类中心邻近数据的密度输入到距离公式中,作为相似性指标度量聚类的效果,解决了K-means聚类算法易受噪声影响的缺陷和样本框中样本不均匀导致的聚类效果不佳的问题。通过目标检测对比实验发现,改进的K-means聚类算法获得的目标检测设定框在目标检测中能够较好地反映目标检测框的分布情况,并在目标检测中具有很好的适配性,获得了更高的目标检测平均精度。(3)针对路面多类目标同时检测时样本不均衡,导致小目标检测效果不佳的问题,本文选取单阶段目标检测算法YOLO V3为研究基础,分别从网络模型的损失函数和网络结构图入手,对YOLO V3目标检测算法进行改进。首先引入Focal Loss损失函数代替原YOLO V3算法中预测框定位平方和损失函数、置信度交叉熵损失函数及类别概率交叉熵损失函数,加快了初始收敛速度,减小了梯度消失的影响,提高了小目标检测的平均精度。接着在原YOLO V3算法网络模型的基础上,将4倍下采样获得的特征图与52×52尺度特征图卷积运算再2倍上采样后得到的特征图融合,获得了拥有更高细粒度的特征图。通过增加一个用于小目标检测的104×104尺度的目标检测模块,提升了神经网络对小目标的检测能力。(4)将改进的YOLO V3算法在自制的路面多类目标检测数据集上进行训练和测试,并完成了YOLO V3算法改进前后目标检测的对比实验和改进后的YOLO V3算法与其他目标检测算法的对比实验。实验结果表明,改进的YOLO V3算法在自制数据集上进行多类目标检测的平均精度都高于其他目标检测算法,平均精度达78.17%,较未改进的YOLO V3算法提高了3.81个百分点,检测速度也达到了46.23帧每秒,满足实时检测的要求。
其他文献
学位
学位
学位
学位
学位
学位
学位
城市街道是城市建设的重要组成部分,其面积占据城市总土地面积的1/3以上。伴随城市化进程的加快,人口基数也在不断增加,致使城市街道排水系统的压力剧增,然而城市街道景观也面临着诸多问题。近几年,政府相关部门也在不断更新城市街道设计,加快城市街道景观建设,但是城市街道的功能和环境问题依旧存在,且难以满足人们的生活和精神所需。因此,城市绿色街道建设势在必行。近几年来,政府不断推出生态城市建设,而建设生态城
铁路安全运营对促进经济增长、增进民生福祉、强化国防安全有重要意义。铁路调度是铁路运营的“中枢神经”,而车务调度人员与列车司机、电务、工务等铁路运营生产单位之间的调度通话作业是铁路运营组织过程中的核心组成部分。以往的语音识别研究主要聚焦通用语、日常用语的识别,面向铁路领域的应用研究侧重于引导购票、客运服务等非安全语音内容的识别。但是针对直接影响行车安全和效率的铁路调度语音识别研究很少论及。本文以铁路
学位