基于深度学习的端到端自动驾驶模型研究及仿真

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：seaflower0000

【摘要】

：

【作者】

：

张健

【机构】

：

电子科技大学

【出处】

：

电子科技大学

【发表日期】

：

2021年01期

【关键词】

：

端到端自动驾驶监督学习深度强化学习神经回路策略网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自动驾驶可以有效缓解交通安全事故,提高交通运输效率,极大的改善现有交通环境。同时自动驾驶的落地也是国家新基建的重要组成部分,因此相关技术的发展有着重要的现实意义。目前自动驾驶方案大致分为两种,基于规则的方案需要人工设计环境感知算法,并结合高清地图完成车辆定位、路径规划、决策控制等一系列算法完成。整个系统设计复杂、成本高昂,由于各场景之前还存在边界模糊,所以整个系统并不是完全可观。基于端到端的自动驾驶方案相对简洁,整个系统只依赖于车辆的感知输入,通过模型的计算直接获得车辆的控制输出。虽然该方案系统简洁、成本较低,但是存在系统不可观、受数据场景限制、系统安全没有理论基础等诸多问题。为了解决系统不可观和数据限制问题,将结合神经回路策略网络（NCP）和深度强化学习进行端到端方案的探索。本文主要研究内容如下:（1）监督学习方案分别设计了CNN+FCNN模型和CNN+NCP模型。两种模型除了在结构上不同外,实现的功能是相同的,即同时实现车辆的转向预测和速度预测。并基于驭势科技工业级自动驾驶模拟器完成了数据集的收集和模型在线仿真。分别从模型的训练、模型参数数量、模型预测效果和模型处理速度四个方面对两种模型进行了对比分析,同时完成了模型特征提取层和映射层的可解释性分析。实验结果表明基于NCP网络的模型相比与基于全连接网络的模型,在使用更少网络参数的情况下,拥有更好的鲁棒性和泛化能力,同时NCP网络的可解释性也得到了验证。（2）深度强化学习方案设计了行为价值网络、状态价值网络和策略网络,同时还设计了通用的奖励函数。并结合三星与谷歌开源的自动驾驶模拟器LGSVL进行了仿真训练和验证。实验一共训练了两张地图,第一张相对简单的地图实验效果明显,模型能够较快收敛。第二张复杂的地图智能体陷入了局部最优难以跳出,最终未能达到期望的希望目标。虽然该方案未能取得理想的效果,但是验证了奖励函数的有效性。最后总结分析了深度强化学习方案的不足和改进方向。

其他文献

基于深度学习的三维点云语义分割技术研究

三维点云语义分割是将点云中的每个点按照各自的类别进行语义的划分,对同一类别的点进行相同的标注。随着三维数据获取的难度变小,基于三维数据的技术开始逐渐发展,也已经开始应用在自动驾驶、智能机器人、遥感和医疗等领域中。点云语义分割算法是三维点云处理的重要方向之一,传统的点云分割方法精度不高,因此,本论文主要研究的内容为基于深度学习的三维点云语义分割,使用的基础网络为PointNet++,并对其从局部空间

学位

三维点云语义分割深度学习PointNet++几何信息增强编码附加信息编码

回复式神经网络若干关键问题研究

回复式神经网络（Recurrent Neural Networks,RNNs）是深度学习领域中的一种基础的人工神经网络,其作为处理序列数据的记忆模型被广泛应用。如何处理好梯度消失与梯度爆炸问题一直是训练RNN的关键和难点。长久以来,人们提出了多种方法来解决RNN训练时的梯度问题,不断设计新的RNN变体用以处理更长的序列。尽管许多经典的模型已经被提出,如何使RNN模型在快速应对序列中短期变化的同时捕

学位

深度学习回复式神经网络长期依赖学习分治策略

基于深度学习的姿态估计方法研究

计算机视觉发展过程中,人体姿态估计任务一直备受关注。在工业界和学术界,姿态估计任务也是极具挑战性的任务之一,目标是使机器尽可能的检测出人体样本中关键节点,比如鼻子、左右肩、脚踝、手腕。随着深度神经网络的引入和应用,人体姿态估计任务往往是预测人类行为规律的基础研究任务,为行人检测、样本重识别、特殊行为检测、人机交互等任务提供了基础预测能力。当前主流的人体姿态估计网络框架分为两种应用型网络,即人体结构

学位

卷积神经网络注意力机制网络架构搜索人体姿态估计

面向表面缺陷检测的深度学习平台设计与实现

在工业产品的生产过程中,通常会无法避免地产生一些表面缺陷,因此需要检测出产品的表面缺陷以便及时发现问题并且对产品质量加以控制。与人工检测方式相比,基于计算机视觉的工业表面缺陷检测方法,具有成本低、安全性好、效率高、灵活性好等诸多优势,已成为自动化缺陷检测系统的重点研究方向之一。针对工业生产中产品的表面缺陷检测问题,本文设计了一种基于计算机视觉的深度学习平台,在表面纹理较规律的缺陷检测任务中取得了很

学位

缺陷检测计算机视觉语义分割算法深度学习平台

图神经网络可解释性的研究与应用

近几年,图神经网络的研究方兴未艾,在诸如知识图谱、社交网络、生物和化学等领域取得了卓越的效果。人们在享受它高效能力的同时,也在从各个方面对其可解释性进行研究,致力于探明其内部决策的机理。数学知识的推理由于知识的标准化、描述的规范化和使用图谱化形式进行推理,与图神经网络具有高度的契合性。因此将图神经网络与数学自动推理系统相结合,可以极大提升系统的学习和推理能力。针对其可解释性进行研究,能够使推理的过

学位

图神经网络可解释性初等数学自动解题

基于神经网络补偿光纤非线性的相干光通信系统研究

光纤通信向着高速率、大容量、远距离传输的目标发展,由于光纤损耗,需要使用光学放大,为增加传输距离,必须相应地使用越来越多的光放大器。光放大器也使噪声放大,为保持较高的信噪比,信号光功率需要增大。然而,当光信号功率超过一定值时,光纤内的非线性会增强,产生非线性干扰噪声。在长距离、高激光发射功率的光通信系统中,光纤中累积的非线性效应成为影响系统通信性能的主要因素,信号由于受到非线性而产生畸变,使得通信

学位

人工神经网络光纤非线性效应光纤非线性补偿相干检测反射式双向传输系统

基于深度强化学习的推荐系统研究

推荐系统被广泛应用于互联网的各个领域中,用来解决当前时代信息过载的问题。它不仅可以帮助用户快速筛选出感兴趣的内容,也为互联网公司创造出了巨大的商业价值。针对用户进行分析是个性化推荐系统的基础和前置工作。基于对某个用户的分析可以发现这个用户对不同物品感兴趣的程度。用户、物品和其他一些附属信息,比如标签信息、物品种类,共同组成了一个异构的信息网络。一般情况下,推荐算法会直接把用户描述为显式或隐式的评分

学位

强化学习推荐系统异构信息网络

基于边缘计算的鲁棒控制方法研究与实现

不断发展的传感、计算和通信技术驱动着信息物理系统和物联网深入到了社会的各个领域,如智能工业过程、智能电网和智能交通等。在工业控制领域,传统的基于可编程逻辑控制器或微控制器的控制系统面临着计算能力较弱、交互能力较差等问题,而随着边缘计算模式的出现和应用,为工业控制系统中智能和复杂控制方法如基于迭代的最优和鲁棒控制方法、模型预测控制等的应用提供了新的思路。本文以工业温度场控制为场景,尝试将边缘计算与控

学位

物联网边缘计算温度场鲁棒控制阵列式控制

随机森林的可视化解释与分析

如今,机器学习已经成功地应用于信息检索、数据挖掘以及计算机语音识别等多个领域。但是,由于其功能和工作机制上的复杂性,实际应用与学习中大多数用户将机器学习模型视为黑匣子,且高性能模型的开发需要耗时的、反复的试验过程。所以,对机器学习的可解释性进行研究探索是一个很重要的命题。学术研究人员需要更加透明和可解释的系统,以更好地理解和分析机器学习模型。可视化分析是将数据转换成富有信息的视图的新兴技术,它利用

学位

可解释性机器学习随机森林随机森林可视化数据可视分析

基于放缩与旋转的复合等变性卷积神经网络研究

如今,卷积神经网络已成为深度学习中的主流模型之一,它在计算机视觉、自然语言处理等任务中具有显著的性能表现。卷积神经网络具有平移等变性,即对输入的平移等效于对输出的平移。然而,对于其他非平移变换,如旋转、放缩,卷积神经网络并不具有等变性。为了解决上述问题,群等变性卷积神经网络由此提出。此外,为了处理非欧几里得空间（如球面）中的图像数据,人们提出了适用于球面流形的球面等变性卷积神经网络。然而,现有的等

学位

等变性卷积神经网络放缩旋转深度学习

基于深度学习的端到端自动驾驶模型研究及仿真

与本文相关的学术论文