基于深度强化学习的自动驾驶研究

来源 :自动化应用 | 被引量 : 0次 | 上传用户：chenweili73924

【摘要】

：

随着神经网络的兴起,强化学习在许多传统游戏上的表现越来越好。然而这些表现并不能应用于自动驾驶当中,因为现实世界中的状态空间极其复杂,而且动作空间是连续的,需要精细的

【作者】

：

刘偲

【机构】

：

北方工业大学电气与控制工程学院

【出处】

：

自动化应用

【发表日期】

：

2020年5期

【关键词】

：

深度强化学习自动驾驶 TORCS 连续控制

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着神经网络的兴起,强化学习在许多传统游戏上的表现越来越好。然而这些表现并不能应用于自动驾驶当中,因为现实世界中的状态空间极其复杂,而且动作空间是连续的,需要精细的控制。为了保证自动驾驶在复杂环境下的稳定性,选用Deep Deterministic Policy Gradient(DDPG)算法代替传统控制方法,此算法有较好的能力处理复杂环境的连续控制问题。选用The Open Racing Car Simulator(TORCS)作为仿真环境,并给出了定量和定性的结论。

其他文献

基于多运动步态的蛇形机器人设计与研究

蛇形机器人是一种仿生机器人,它的作用是代替或者辅助人类完成危险系数较高的工作。仿生机器人在设计过程中完全是按照自然界生物的结构,使其拥有自然界动物的运动特点,从而

期刊

多运动步态蛇形机器人仿生设计从控系统

基于S7-200PLC的螺旋压力机伺服控制系统设计

近年来,伺服压力机行业由于缺乏拥有自主知识产权的技术及控制方案,与其他国家的相关企业有着明显差距。随着国内经济的发展,各行业对大型伺服压力机的需求逐渐增加。以螺旋

期刊

S7-200PLC螺旋压力机伺服控制方案打砖恒扭矩恒压力触摸屏

优化催柴质量途径的探索

催化裂解柴油质量不好，易变色，给经营销售带来很大困难。曾采用过白土精制办法，但效果不佳，损失率大；经探索采用柴油复合精制剂，该工艺合格率高，损失率小，效益可观。

期刊

催化裂解柴油质量白土精制复合精制剂Catalytic cracking Diesel oil quality Clay refining Compoun

超声引导下胸膜活检在疑似结核性胸膜炎患者中的诊断效能分析

<正>目的分析比较超声引导下胸膜活检病理为肉芽肿性炎及抗酸染色阴性结果与胸水抗酸染色、胸水结核菌培养、胸水Xpert、胸水结核分枝杆菌特异性核酸(DNA)以下简称胸水DNA、

会议

机械密封失效原因及改进

机械密封又称端面密封，是一种密封效果好、使用寿命长的轴封装置，但由于使用条件苛刻，给机械密封的使用也带来了一定困难。本文结合实际，分析了机械密封损坏原因，介绍了如何选择摩

期刊

机械密封寿命损坏摩擦副改造Mechanical seal Life Damage Friction fair Improvement

3-PRS柔性并联平台的设计与仿真分析

为实现并联机构大行程、高精度的运动要求,设计了由压电陶瓷电机驱动的基于大行程柔性铰链的3-PRS柔性并联平台,平台可实现厘米级行程、亚微米级精度。基于伪刚体模型分析平

期刊

柔性并联平台运动学仿真分析

基于深度强化学习的自动驾驶研究

其他学术论文