状态空间构建相关论文
在强化学习的背景下,训练效率随状态空间的大小呈指数级衰减,尤其是在具有连续动作空间的机器人控制领域中,高维连续的状态空间和......
针对模型未知以及具有连续状态的系统控制问题,提出一种基于强化学习的自适应控制策略。在Actor-Critic框架下,建立归一化径向基网......