【摘 要】
:
在自动驾驶环境感知系统中,机器视觉已经成为众多解决方案的首选。然而,机器视觉仍然存在复杂驾驶环境适应性差、算力要求高等问题,仍然达不到人类视觉的一般水平。如何模拟人类视觉使之更好地理解驾驶场景,成为推动ADAS技术变革,实现L4级别的完全自动驾驶视觉感知技术的关键问题之一。为满足复杂驾驶场景下机器视觉检测任务的速度、准确性和鲁棒性达到最优的要求,本文以驾驶员视觉注意力、前方道路目标和可行驶区域作为
论文部分内容阅读
在自动驾驶环境感知系统中,机器视觉已经成为众多解决方案的首选。然而,机器视觉仍然存在复杂驾驶环境适应性差、算力要求高等问题,仍然达不到人类视觉的一般水平。如何模拟人类视觉使之更好地理解驾驶场景,成为推动ADAS技术变革,实现L4级别的完全自动驾驶视觉感知技术的关键问题之一。为满足复杂驾驶场景下机器视觉检测任务的速度、准确性和鲁棒性达到最优的要求,本文以驾驶员视觉注意力、前方道路目标和可行驶区域作为研究对象,开展了基于拟人视觉的多任务检测算法研究,主要进行的工作如下:(1)针对现有的机器视觉目标检测算法缺少专门针对复杂驾驶场景的注意力筛选机制,导致精度差的问题,提出基于驾驶员注意力高层感知特征的道路目标检测算法。由人类视觉选择性注意机制角度出发,对驾驶场景视觉显著性进行建模,分别从驾驶任务驱动和驾驶员主观意识驱动两个方面进行分析,并构建了驾驶场景视觉注意力显著性数据集。(2)针对车载硬件运算资源有限,现有视觉检测算法中单个模型同时完成多个任务难度大、性能差的问题,提出面向复杂驾驶场景的端对端多任务检测算法。首先为了提高视觉检测任务的精度和鲁棒性,研究基于深度学习的单目机器视觉优秀算法,包括基于Anchor-free的道路目标检测算法和基于“编码器-解码器”的可行驶区域检测算法。然后利用多任务学习中参数硬共享与软共享机制相结合的方法,同时结合人类视觉选择性机制,完成整体网络结构与损失函数的设计。整体结构是由一个主干模块和三个分支模块组成。为保证模型的实时性,主干模块采用改进的轻量化特征提取网络MobileNet V3实现底层的特征共享,三个分支模块分别为驾驶员注意力监督模块、道路目标检测模块和可行驶区域检测模块,损失函数采用加权联合的方式进行计算。(3)搭建实验平台对整体模型进行线下训练和线上测试,并在车载电脑上对算法进行在线实车验证。实验结果表明,模型引入驾驶员注意力对道路目标检测的m AP贡献最大,增加3.65%。从模型的单个任务角度,检测部分参数仅为FCOS模型的8.79%,car类别的AP值提升0.56%,同时检测时间减少8.55ms;分割部分的准确率优于UNet和Seg Net模型,MAE值也最低。多任务模型无论是在天气晴好的白天,还是在夜晚出现强烈的灯光干预、逆光的情况下,都能精准又稳健地对前方车辆、骑行者和行人三类道路目标以及可行驶区域进行实时统一检测,可以满足正常车载计算平台对于实时性的需求。
其他文献
高超声速飞行器具有重大的战略意义,而其发展很大程度上取决于诸多基础科学问题,如边界层转捩问题。对边界层转捩进行有效预测和控制,可大幅降低高速飞行器的油耗、增加有效载荷。目前,地面风洞试验仍是高超声速边界层转捩研究的支柱手段。然而,由于风洞湍流壁面噪声辐射等问题,我国现有的高超声速风洞获取的边界层转捩数据同飞行试验仍存在较大差异。结合现实需求和国内外研究型实验平台建设经验,本文开展了基于高超声速Lu
非公企业数量多,分布广,单独建支部的方法只能形成零散的团建局面,无法达到预期效果。在实际工作中,为了构建凝聚力更强、创新性协同性更好的建团局面,团市委根据不同情况形成楼宇团建与乡镇园区团建两套发展模式。在非公有制经济迅速发展并集聚了越来越多青年的新形势下,团扬州市委切实加强我市非公有制企业团组织建设,广泛、有效地团结、凝聚、教育和引导青年,这是巩固党执政的青年群众基础的需要,也是服务非公有制
空间目标方向关系在空间分析、空间推理、制图综合等过程中起着重要的作用,与空间距离、空间拓扑关系一样是GIS的重要理论问题。由于地学空间信息的复杂性和相对性,使得空间分析方法的研究成为制约地学空间信息技术发展的瓶颈。地学信息图谱是将海量信息经过图形思维与抽象概括,并以计算机多维动态可视化技术显示各要素和现象的时空变化规律,能够用简单的、典型的图谱来表示复杂的目标间的关系,为地学空间分析提供一种全新的
为残疾人制定科学、合理的就业政策,完善就业增收及公共服务,全面凝聚残疾人的就业动力,促进残疾人在参与就业过程中,充分实现残疾人的个人价值。本文将结合《中国残疾人职业教育与就业服务》一书,分析以职业技能培训为导向的残疾人就业政策机制制定背景,探索基于职业技能培训为导向的残疾人就业政策机制,以期为当前持续改善残疾人就业质量提供有效参考。
随着科技的进步,无人机(UAV:Unmanned Aerial Vehicle)自主着陆技术在各领域起到了至关重要的作用,而着陆标识的分类与识别技术是无人机自主着陆的前提。为了提高无人机对着陆标识的分类与识别能力,本文在深入讨论基于卷积神经网络(CNN:Convolutional Neural Network)图像分类模型的基础上,重点研究了对着陆标识先分类后识别的方案,准确的提取着陆标识的特征角
晶体管技术越来越接近摩尔定律的极限,对具有高性能和高能效的下一代器件需求迅速增长。旨在模拟生物神经元和突触功能的神经形态器件可能为后摩尔定律时代提供新的思路。在各种神经形态器件中,电解质调控的双电层晶体管独特的界面耦合及电化学效应类似于生物突触动态响应行为。另外,双电层晶体管巨大的双电层电容和可能的电化学反应,能够降低栅极电压,进而降低器件功耗。因此,利用双电层晶体管实现突触仿生从而构建神经网络,
本文在“经济增长+通货膨胀+债务风险”的三维框架下,系统分析了当前及未来五年美国的宏观经济格局。研究结果表明:一是在新冠肺炎疫情冲击、老龄化加剧、新一轮科技革命尚未到来等因素的影响下,美国经济将处于低迷增长的态势。二是美国的总需求并不强劲、劳动力等生产成本不会出现大幅上涨,再加上货币政策治理通货膨胀的框架没有发生实质性变动,因而美国不会出现显著的通货膨胀压力,而将处于温和通货膨胀状态。三是美国家庭
乡村产业振兴是实现乡村振兴的根本和关键,产业兴旺是解决农村问题的前提。在全面推进乡村振兴的背景下,山区民族乡村作为具有代表性的农村地区,其产业发展情况关系到区域与不同民族的平衡发展问题。促进山区民族乡村产业振兴,进而推动这些后发区域的经济又好又快发展,不仅可为我国区域、城乡发展不平衡问题“补短板”,也对当前打赢脱贫攻坚战、实现全面小康的战略目标具有重大意义。目前,大量山区民族乡村在城市化发展过程中
现阶段,我国农村社会的发展较为迅速,随之而来的矛盾纠纷也变得更加多元与复杂。过去,我国农民思想较为封闭落后,相对传统,现如今,逐步走向现代化。我国农民由过去的思想封闭、落后和传统的状态逐步走向现代、开放与发展的趋势。随着农村社会经济的不断发展以及农民维权意识的不断增强,涉农纠纷不仅仅局限于土地产权、人际关系等方面,还涉及到占地赔偿、劳务纠纷等方面。随着农村产业的不断发展,生产活动对环境的破坏也成为
火力发电是一种最传统的发电方式,发电总量占我国总发电量的80%以上。随着而来的是发电厂烟囱内壁的腐蚀问题。传统的烟囱内部图像采集方法是人工到达烟囱顶端再利用吊绳或升降机进入烟囱内部对其进行图像采集工作。该方法不仅费时费力,还给工作人员带来生命的安全隐患。本文主要针对烟囱内部检测中的图像采集环节,研究和设计了一套基于无人机悬挂平台的烟囱内部图像采集系统,降低了传统人工进入烟囱内部作业的风险,提高了烟