基于深度确定性策略梯度的智能车汇流模型

来源 :计算机工程 | 被引量 : 0次 | 上传用户:yecao126128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用离散动作空间描述速度变化的智能车汇流模型不能满足实际车流汇入场景的应用要求,而深度确定性策略梯度(DDPG)结合策略梯度和函数近似方法,采用与深度Q网络(DQN)相同的网络结构,并使用连续动作空间对问题进行描述,更适合描述智能车速度变化。为此,提出一种基于DDPG算法的智能车汇流模型,将汇流问题转化为序列决策问题进行求解。实验结果表明,与基于DQN的模型相比,该模型的收敛速度较快,稳定性和成功率较高,更适合智能车汇入车辆场景的应用。
其他文献
分析研究了引汉济渭秦岭隧洞TBM施工段长距离连续皮带机的布置、设备选型和支架性能,并对连续皮带机安装和运行过程中的问题及处理措施进行了阐述和介绍.为满足要求,TBM施工
核心阅读$$“脱贫不脱政策”是实现稳定脱贫的有效途径,有助于维持贫困人员脱贫的稳定性,但此政策在实施过程中还面临一些现实问题。我们应该正视这些问题,采取有效措施,保证“脱
报纸
为了准确鉴定鸭绒、鸡绒及鸽绒,对其一维红外光谱、二阶导数红外光谱和同步二维红外光谱进行了研究。研究发现:鸭绒、鸡绒及鸽绒同时存在着-CH3不对称及对称伸缩振动模式、-CH2
随着我国经济的不断发展,人民生活水平的不断提高,口腔外科门诊的临床工作量也有持续上升的趋势。近年来,口腔外科门诊的突发医疗紧急事件的发生率呈现逐年上升的趋势,口腔外
介绍对设备自动加油系统、光电探边系统、电热管等部分的改造情况及效果。
目的探讨热毒宁注射液对小儿毛细支气管炎的疗效。方法将2014年1月到2015年11月近期在本院接受治疗的288例婴幼儿毛细支气管炎患儿作为研究对象,随机均分为A组和B组,每组144
与窦宏恩先生讨论了低渗透储集层有无应力敏感性,岩石压缩系数,有效应力,启动压力梯度,孔隙度不变性原则等油藏工程中常遇到的一些基本概念及其数学表述。这些问题的正确解答
随着人文素质教育在口腔种植学研究生教育中地位的日益凸显,有必要对口腔种植学研究生培养过程中人文素质教育现状进行分析研究。本研究对某医学类大学口腔种植学研究生进行
采集了太湖梅粱湾的柱状沉积物,分析和研究了沉积物中磷的形态、吸附动力学以及潜在的可交换性磷随深度的变化.结果表明,样品中各形态的磷含量随着深度增加总趋势为减小.不同深度
本文首先阐述了“知识论坛”作为促进知识建构的有效网络学习平台诞生的时代背景与理论框架以及在西方发达国家的应用;其次,讨论了“知识论坛”作为一种以西方社会建构主义思想