基于深度递归强化学习的无人自主驾驶策略研究

来源 :工业控制计算机 | 被引量 : 0次 | 上传用户:ARCHERY6805068
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于递深度递归强化学习的自动驾驶策略模型学习方法,并在TORCS虚拟驾驶引擎进行仿真验真。针对Actor-Critic框架过估计和更新缓慢的问题,结合clipped double DQN,通过取最小估计值的方法缓解过估计的情况。为了获取多时刻状态输入以帮助智能体更好的决策,结合递归神经网络,设计出包含LSTM结构的Actor策略网络的Critic评价网络。在TORCS平台仿真实验表明,所提算法相对与传统DDPG算法能有效提高训练效率。
其他文献
针对某型航空发动机在进行台架试验时发生的高温振动传感器突然无信号输出问题,详细分析了其故障机理、提出了针对性改进措施。通过试验验证,表明了改进措施的有效性。
通过研究对石油和化工行业中的防爆的电气设备运用进行了系统性的分析,核心目的是通过实践技术的优化探究,完善工程项目设计的核心理念,从而为石油和化工行业防爆电气设备的合理
本文从对"教师惩戒权"评议入手,通过对个性自由与教育常理常规的分析,说明如今学生难管难教的缘由。
第六届IEEE International Conference on Dependable Systems and Their Applications(DSA)将于2020年1月3日~6日在美丽的哈尔滨举行。我们诚挚地邀请您投稿参与。除了regul
为持续推动我国空间信息技术的发展,建立高水平的空间信息技术学术交流平台,中国电子学会拟于2020年5月在北京举办“2020空间电子信息学术交流大会”,会议将围绕理论创新、技
为了改善沙漠环境下军用机械装备发动机的进气质量,延长其平均故障间隔时间,提高整机的使用寿命和安全可靠性,必须提高空气预滤器的效能。运用参数化设计方法,建立了沙漠空气预滤
目的 探讨罗哌卡因腰-硬联合麻醉对剖宫产产妇血流动力学及麻醉质量的影响。方法 按照随机数字表法将行剖宫产分娩的50例产妇均分为观察组和对照组各25例,对照组给予大剂量罗
目的探讨中年人上消化道出血的病因与疗效。方法回顾性分析220例中年人上消化道出血患者的临床资料,与同期接受治疗的180例老年上消化道出血患者比较病因与治疗结果。结果中年
介绍了胶轮单轨电车系统的主要技术特点。
针对目前已有的行人检测算法存在的误检率高、实时性差等问题,首先基于Yolov3-tiny网络模型进行算法改进,提出一种Ped-tiny网络模型。通过采用深度可分离卷积层替代部分原始网络中的传统卷积层来适当加深特征提取网络,同时增加一尺度的预测层,保证各个尺度的行人目标被精准检测到;其次结合GMM(混合高斯模型)的运动目标检测算法,该算法能有效利用目标运动时所产生的运动信息对行人目标进行检测、定位;