自动驾驶复杂场景下目标检测研究

来源 :西安工业大学 | 被引量 : 0次 | 上传用户:cjw37600
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,汽车数量增加导致的交通问题层出不穷,由此引发的自动驾驶研究已被国内外众多企业提上日程。随着深度学习的发展,一般简易交通场景下的目标检测精度已可达驾驶标准,但面对复杂场景下的目标检测,道路中存在遮挡目标和小目标检测,通过传统算法无法获取更高精度的检测。因此,本文采用了深度学习为基础的目标检测技术,分析自动驾驶复杂场景下目标检测的重难点,进而研究适用于复杂场景下的目标检测算法。具体的研究工作如下:1)通过对比实验,分析了典型目标检测算法,选择算法改进对象。首先基于当前目标检测中常用的基于深度学习的目标检测技术,通过实验研究和分析了三类经典目标检测算法,分别为Faster Regions with CNN features(Faster R-CNN)、Single Shot Multi Box Detector(SSD)和You Only Look Once Version Five(YOLOv5)。实验结果显示,不论是检测精度还是检测速率上,YOLOv5算法皆优于其它两者,因此本文以YOLOv5为基础框架对复杂场景下的目标检测算法进行研究和改进。2)提出了一种改进的聚类算法。本文改进了传统K-means聚类算法以生成更适合自动驾驶复杂场景下的锚框。改进后的K-means算法解决了原本K-means算法中初始聚类点选取随机而导致的最终结果与最准确聚类相差较大问题,缓解了传统聚类算法的局部最优的问题。改进后的K-means算法所生成的锚框可获得更好的泛化能力,针对本文可适用于复杂场景下的目标检测。3)重构了一种更倾向于对正样本和难分类样本的损失函数模型。在One-Stage类型算法中,由于未采用FPN网络对目标进行粗筛,因此在目标检测中会面临正负样本不均衡问题,而复杂场景下的小目标数量上升进一步加剧了该问题。由此本文将损失函数中的分类损失和置信度损失中引入焦点损失(Focal Loss),针对不易识别样本进行加权学习,以此缓解小目标检测精度不足问题。同时,采用CIOU loss作为边界框回归损失以达到预测框与真实框更为准确的差距,从而缓解复杂场景下同一区域目标密集而导致的遮挡目标漏检问题。同时,本文将CIOU引入NMS算法中,用以准确识别密集区域目标边界框。4)重构了一种目标检测网络模型,提出了一种面向自动驾驶复杂场景的目标检测算法。本文提出的面向自动驾驶复杂场景的目标检测算法,用于解决YOLOv5算法在复杂场景下遮挡目标漏检率较高问题。本文首先在神经网络结构上,在backbone主干网络中引入DCN(Deformable Convolutional Networks)网络,其次,采用CIOU Loss作为本文算法的回归损失函数中的边界框回归损失,用以解决遮挡目标预测框与真实框定位差距较大问题。对比实验结果表明,本文提出的复杂场景下的目标检测算法在保证实时性的情况下在复杂数据集COCO和KITTI上检测精度提升了2.9%。
其他文献
随着电商的迅速发展和客户需求的不断变化,对仓配中心的货物拣选效率提出了更高的要求。货位指派和订单分批作为影响拣选效率的关键因素,成为企业急需解决的重要问题。本文基于货到人拣选模式,研究订单随机到达的货位指派与订单分批问题,首先,在考虑了随时间动态变化的商品需求频率和关联性的前提下构建动态货位指派和订单分批模型;其次,针对现有拣选策略的不足设计新的拣选策略和求解算法;最后,进行仿真实验对比不同拣选策
学位
随着虚拟现实技术的快速发展,虚拟手术作为虚拟现实技术在医学领域的典型应用,已从传统的视觉交互向触觉交互发展,因此力反馈模型的研究成为虚拟手术的关键技术,一个良好的力反馈模型和力反馈算法可以为虚拟手术带来更强的沉浸感。本文以虚拟现实技术在口腔医疗教育培训中的应用作为背景展开,研究了力反馈的两个阶段,即几何建模阶段和力反馈建模阶段,在现有力反馈模型基础上提出了改进方案,解决了反馈力输出不连续且不稳定的
学位
为保障生态文明建设,实现可持续发展,中国在2020年提出了双碳战略目标。作为近年来快速发展的综合性服务业,物流业的碳排放量一直在我国占据较大比重,为响应国家的双碳目标,急需由高碳排放发展模式向低碳发展模式转型,而环境规制是实现低碳物流转型的重要手段。目前关于环境规制的研究主要从单一环境规制工具的角度出发,较少考虑不同环境规制工具的交互作用;同时现有研究还发现环境规制对我国碳排放效率存在非线性的门槛
学位
视线估计技术是利用现有的不同检测方法获取用户当前注视方向的技术。视线估计在生活中发挥着越来越重要的作用。在注视的过程中,伴随着头部的运动行为,如何提高头部运动变化时中的视线估计精确度,是目前视线估计领域的一个挑战。本文提出使用眼动特征并结合头部运动变化特征的视线估计模型。论文主要研究了如下内容:1)眼动特征提取本文眼动特征主要包括瞳孔中心、眼角点以及二者构成的眼动向量。首先应用Haar特征和Ada
学位
当前光学遥感图像目标检测技术在军事、环境、城市规划、农业、林业等领域有着广泛的应用。与自然图像相比,遥感图像具有小目标多且密集分布、方向多样、背景复杂和目标尺度变化范围广泛等特点,这为通用目标检测算法在遥感图像上的应用带来了一定的挑战。对此也有很多针对性的改进算法被提出来,但是大多都只从遥感图像中的某一两个难点问题出发,而缺乏一定的综合性,其检测性能也很难达到在普通图像上的较高水平。为了能够更加快
学位
随着大数据信息化时代的到来,各个领域数据信息急剧增长,人们对数据信息处理技术的要求也越来越高。压缩感知突破奈奎斯特采样定律,很大程度上缓解了数据的获取和传输压力。传统的压缩感知重构算法需要进行多次迭代求解原始信号,使得算法计算速度慢,重构精度差,且不具有实时性等优势。近年来,随着深度学习的快速发展,深度神经网络技术在压缩感知领域的应用有效地提高了压缩感知重构的精度和效率,并引起学者们的广泛关注和研
学位
如今的互联网时代,大量的新闻出现在人们的日常生活中,需要人们花费更多精力和足够时间在庞大的信息库中去搜索和甄别我们感兴趣的内容,而文本自动摘要技术可以在不更改文章含义和不丢失其重要信息的前提下,概括出新闻的关键信息和主体内容,从而帮助人们减少阅读的时间。近年来指针生成网络模型(Point Generator Network,PGNet)的提出极大地促进了摘要生成技术的发展,有效解决了未登陆词无法生
学位
随着软件规模的不断增加和复杂性的提高,软件中存在的安全隐患也越来越多,这使得软件容易受到不法分子的攻击。为了有效提高软件的安全性,漏洞检测技术成为了软件安全领域的研究重点。由于图模型具有较强的表征能力,基于图模型的漏洞检测研究应运而生。然而,现存的图模型在源代码的表征过程中,存在图模型较为单一而导致的源代码表征信息缺失,使漏洞检测的误报率增加的问题。同时由于源代码结构复杂,导致对应图结构信息冗杂,
学位
随着生产力水平的发展,人们对于软件功能的需求不断增加,导致软件的体系结构也随之变得复杂,无形之中提高了软件中可能存在安全缺陷的概率。此外,代码复用也会给漏洞的传播提供可乘之机。一旦这些安全漏洞被不法分子所利用,所造成的损失不可估量。因此,如何保证软件安全成为人们亟待解决的问题。随着深度学习技术在图像领域以及自然语言处理领域获得了巨大的成功,大量的信息安全研究人员也开始使用深度学习的方法来进行漏洞检
学位
股权质押作为一种融资方式,具有成本低、限制条件少、操作简单等优势,受到了部分上市公司的青睐。股权质押虽具有诸多优点,但是也存在着潜在的风险。当控股股东进行高比例的股权质押活动时,会加大现金流权和控制权的分离程度,引发代理问题,将会损害债权人和中小股东的利益。同时,在高比例的股权质押下控股股东还会为了维持自身利益的最大化而去损害公司价值。因此,研究控股股东股权质押对公司价值影响的路径和程度,对于加强
学位