基于深度强化学习的自动驾驶研究

来源 :自动化应用 | 被引量 : 0次 | 上传用户:chenweili73924
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着神经网络的兴起,强化学习在许多传统游戏上的表现越来越好。然而这些表现并不能应用于自动驾驶当中,因为现实世界中的状态空间极其复杂,而且动作空间是连续的,需要精细的控制。为了保证自动驾驶在复杂环境下的稳定性,选用Deep Deterministic Policy Gradient(DDPG)算法代替传统控制方法,此算法有较好的能力处理复杂环境的连续控制问题。选用The Open Racing Car Simulator(TORCS)作为仿真环境,并给出了定量和定性的结论。
其他文献
蛇形机器人是一种仿生机器人,它的作用是代替或者辅助人类完成危险系数较高的工作。仿生机器人在设计过程中完全是按照自然界生物的结构,使其拥有自然界动物的运动特点,从而
近年来,伺服压力机行业由于缺乏拥有自主知识产权的技术及控制方案,与其他国家的相关企业有着明显差距。随着国内经济的发展,各行业对大型伺服压力机的需求逐渐增加。以螺旋
催化裂解柴油质量不好,易变色,给经营销售带来很大困难。曾采用过白土精制办法,但效果不佳,损失率大;经探索采用柴油复合精制剂,该工艺合格率高,损失率小,效益可观。
<正>目的分析比较超声引导下胸膜活检病理为肉芽肿性炎及抗酸染色阴性结果与胸水抗酸染色、胸水结核菌培养、胸水Xpert、胸水结核分枝杆菌特异性核酸(DNA)以下简称胸水DNA、
会议
机械密封又称端面密封,是一种密封效果好、使用寿命长的轴封装置,但由于使用条件苛刻,给机械密封的使用也带来了一定困难。本文结合实际,分析了机械密封损坏原因,介绍了如何选择摩
为实现并联机构大行程、高精度的运动要求,设计了由压电陶瓷电机驱动的基于大行程柔性铰链的3-PRS柔性并联平台,平台可实现厘米级行程、亚微米级精度。基于伪刚体模型分析平