面向自动驾驶场景的目标检测算法研究与应用

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户：habits

【摘要】

：

【作者】

：

赵家瀚

【出处】

：

南京邮电大学

【发表日期】

：

2021年03期

【关键词】

：

自动驾驶计算机视觉目标检测小目标轻量化模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自动驾驶技术在未来交通智能与互联化发展中扮演重要角色,它可以在为人们的出行规避风险的同时,提供便利。而计算机视觉技术在自动驾驶技术中发挥着重要作用,其中又以目标检测技术为重中之重。近年来,深度学习异军突起,将计算机视觉技术推陈出新,从而为自动驾驶的真正落地提供了极大的助力。但是,自动驾驶场景中的感兴趣目标,如行人、车辆等,大小尺度繁多,且道路背景变化极大,又有光线强弱和模糊遮挡等因素干扰,面向自动驾驶场景的目标检测算法的性能还有待于提高。本文以上述内容为背景,深入研究了面向自动驾驶场景的目标检测算法,主要内容包括:(1)自动驾驶场景下的目标检测对算法精度和速度的权衡提出了需求,并对场景中多尺度目标都敏感,尤其是其中的大量小目标。针对这一问题和单阶段算法固有的处理样本类别不平衡问题方面的缺陷,本文设计了一种平衡正负样本的单阶段目标检测算法BANet,该算法结合扩张卷积和特征融合思想对SSD算法的网络结构进行改进,以增大感受野和丰富浅层语义信息,从而增强模型对小目标的敏感度;为解决单阶段算法训练过程中固有的样本类别不均衡问题,本文重新设计用于将预测边框分类的损失函数,以替代原算法中标准交叉熵。KITTI实验结果显示,BANet在准确率指标m AP上超越了原SSD算法。(2)同时,为了优化模型的存储空间和降低其计算量,减少其对硬件配置的依赖,本文设计了一种轻量化的单阶段目标检测算法Tiny FCOS,吸纳无锚框逐像素预测的FCOS算法的优点,规避了锚框所带来的所有人工超参数与额外计算量,同时利用其pixel-based结构结合语义分割中的技巧进一步发挥其潜力:以轻量化语义分割模型LEDNet中的基本网络结构构建轻量化主干网络,并采用标准化空洞卷积组结构搭建轻量化的特征金字塔,同时对原FCOS预测分支进行简化。以与目前主流的轻量化模型Tiny YOLOv3相仿的参数量、计算量、速度,在数据集PASCAL VOC的测试集上的实测精度指标mAP也超过了Tiny YOLOv3。同时,KITTI实验结果显示,在自动驾驶场景这种高分辨率输入时也不失为一种精度与速度兼顾的目标检测算法。(3)本文将上述提出的算法应用于自动驾驶场景目标检测系统中,从而实现对道路中行人车辆等主要目标的实时检测与识别功能并进行可视化展示,最后结合Python GUI技术完成本系统的设计与展示功能。

其他文献

基于苏5区块叠后高分辨率地震资料的构造与储层研究

苏5区块位于苏里格气田中北部,主要产层位于二叠系石河盒组以及山西组,属于陆相辫状河、曲流河沉积。储层纵向非均质强,横向随河道迁移剧烈变化。随着苏5区块勘探开发工作不

学位

苏里格气田苏5区块叠后高分辨地震断层识别构造解释储层预测

“音叉”网站乐评翻译实践报告

本文是基于收录于音乐网站“音叉”(Pitchfork)音乐评论的英汉翻译实践报告。每篇文章所探讨的专辑都互不相同,因而在内容上各有侧重。此外,这些乐评文章由不同作者所编写,因

学位

音乐评论尤金·奈达功能对等理论

基于LabVIEW与神经网络的手写汉字图像细化方法研究

随着人工智能技术的高速发展和中国制造的崛起,汉字识别技术也越受关注。其中手写汉字细化得到的端点、交叉点和像素间的角度等特征信息都是手写汉字识别的部分依据。本文重

学位

手写汉字细化神经网络LabVIEW骨架提取

基于密度泛函理论的固体表面及吸附计算

小分子在固体表面的吸附是研究催化反应以及表面扩散的关键一环,密度泛函理论(Density functional theory,DFT)经过多年发展,其对物质第一原理意义上的预测正在逐步走向现实,

学位

密度泛函理论表面吸附MgCl2表面Au(111)表面

没食子酸丙酯捕收剂对铝硅矿物浮选性能与作用机理研究

我国铝工业快速发展使人们对铝土矿的需求与日俱增,但是由于我国铝土矿以高铝-高硅-低铝硅比的一水硬铝石型为主,难以直接满足拜耳法生产氧化铝的需求,因此铝土矿的提质脱硅

学位

铝硅矿物浮选捕收剂作用机理

二维Fe-P单层结构、稳定性及物理性质的理论研究

二维材料由于其特有的物理、化学性质受到了各个领域研究者的广泛关注。理论计算、材料模拟和结构预测已经成为研究二维材料性质和设计新型二维材料的重要手段。此外,自下而

学位

密度泛函理论二维Fe-P单层金属性铁磁性析氢反应

不可混溶液滴正碰动力学过程的数值模拟研究

液滴碰撞现象广泛存在于自然界和工业应用之中。虽然前人已经对液滴碰撞问题做了大量研究,但前人主要局限于相同组分液滴的碰撞,缺少对不可混溶液滴碰撞的定量研究。因此本文

学位

液滴碰撞最大变形三相流体扩散界面方法自适应网格

基于众包的维吾尔语多源百科知识平台构建研究

随着“一带一路”的持续开展,各个民族之间的交流日益增多,新疆作为少数民族聚集区,加强少数民族尤其是维吾尔族信息文字技术处理对新疆地区经济建设和信息安全都有着重要的

学位

维吾尔语百科知识库构建众包多知识源激励机制质量控制

分散模型预测控制算法及其应用研究

从经典的模型预测控制算法到精确的显式模型预测控制算法再到显式模型预测控制近似算法,模型预测控制算法以其能显式处理复杂约束优化问题的特点,逐渐被工程控制界所认可。相

学位

预测控制建模分散控制最优计算

三角形蜂窝异面能量吸收与缓冲性能的研究

蜂窝结构材料以其优异的能量吸收和缓冲性能而被广泛应用于缓冲包装、航空航天工业、建筑等多个领域。三角形蜂窝作为一种典型的蜂窝结构,在实际应用中常在其异面方向上承载,

学位

三角形蜂窝异面有限元模拟能量吸收缓冲性能

面向自动驾驶场景的目标检测算法研究与应用

与本文相关的学术论文