奖励塑造相关硕士博士期刊学术论文

大数据技术发展产生的海量数据急需一种可靠的数据存储方法，现有的主动故障预测方法相比被动容错机制可取得更好的效果，但是故障硬盘......

期刊

针对空间轨道博弈过程中的集群卫星和非合作目标追逃博弈情形下的动力学模型复杂、非合作目标机动信息未知,以及卫星间难以有效协......

期刊

自主装修机器人在执行各种任务时需要在装修环境中来回移动。自主路径规划能力是一个移动机器人智能化的重要衡量因素。这要求移动......

学位

路径规划问题是一个非常经典的问题,在很多领域有广泛应用,通过深度强化学习技术来解决路径优化问题近年来吸引了大量学者关注,已......

学位

DQN算法 DDPG算法路径规划 LSTM网络奖励塑造

现有无人车辆的驾驶策略过于依赖感知-控制映射过程的“正确性”,而忽视了人类驾驶汽车时所遵循的驾驶逻辑.该研究基于深度确定性......

期刊