基于MCPDDPG的智能车辆路径规划方法及应用

来源 :控制与决策 | 被引量 : 0次 | 上传用户:zybx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对智能车路径规划过程中常存在动态环境感知预估不足的问题,使用基于蒙特卡罗深度策略梯度学习(Monte Carlo prediction deep deterministic policy gradient, MCPDDPG)的智能车辆路径规划方法,设计一种基于环境感知预测、行为决策和控制序列生成的框架,实现实时的决策和规划,并输出连续的车辆控制序列.首先,利用序贯蒙特卡罗预估他车行为状态量;然后,设计基于强化Q学习的行为决策方法,使智能车辆实时预知碰撞风险,采取合理的规避策略;最后,构建深度策略梯度学习网络框架,获取智能车辆规划路径的最优轨迹序列.实验结果表明,所提方法能够缓解环境感知的预估不足问题,提升智能车辆行为决策的快速性,保障路径规划的主动安全,并输出连续的轨迹序列,为智能车辆导航控制提供前提.
其他文献
非线性方程组的求解是优化领域的一个重要研究课题.近年来,利用智能优化算法求解非线性方程组己成为一个重要方向.首先介绍非线性方程组的定义;其次,根据智能优化算法求解非
目的:社会功能已经成为临床精神科医生关注的重要指标之一,但其对临床诊疗的影响力及目前应用的情况尚不清楚;目前评价社会功能的量表众多,如GAF、PSP等,但往往用在临床研究
针对常规的发射子阵分割会使混合MIMO相控阵雷达的孔径减小和馈电网络复杂度增加的问题,提出一种交错稀疏的发射子阵分割方法,通过寻求最大输出信干噪比的方式获得最佳的阵列