actor-critic框架相关论文
兵棋推演是一种较为复杂的博弈对抗过程,是支持复杂对抗方案决策优化的重要手段。传统的基于兵棋推演的决策分析主要限于使用规则......
随着人工智能的迅速发展,深度强化学习算法被广泛地应用在机器人领域,以解决机器人操作技能学习问题。推动和抓取技能是家庭服务机......
为保证无人船对期望轨迹的高动态精确跟踪,针对带有输入饱和限制的无人船轨迹跟踪系统,提出一种基于强化学习的指定性能轨迹跟踪最......
深度强化学习在训练过程中会探索大量环境样本,造成算法收敛时间过长,而重用或传输来自先前任务(源任务)学习的知识,对算法在新任......
将人工智能应用于兵棋推演的智能战术兵棋正逐年发展,基于Actor-Critic框架的决策方法可以实现智能战术兵棋的战术行动动态决策。......
电动汽车用电机的参数辨识可以使电机在任意转速下尽可能输出更高的转矩及效率,是优化电机输出性能的重要手段。传统的基于模型驱......