R-learning 相关硕士博士期刊学术论文 - 搜论网

R-learning相关论文

多步R学习算法

目的讨论平均准则下控制马氏链的强化学习算法,在事先未知状态转移矩阵及报酬函数的条件下,通过试凑法寻找使得长期每阶段期望平均......

期刊

强化学习平均报酬 R学习 Markov决策过程即时差分学习 reinforcement learning average reward R-learning

基于平均报酬强化学习的电梯群组调度研究

针对电梯群控系统,建立基于平均报酬强化学习的优化调度模型。采用R-learning的平均报酬强化学习求解算法,在分析电梯群组调度问题......

期刊

强化学习 R—learning 电梯群组调度离散事件动态系统 reinforcement learning R-learning elevator gro

看过本文同时还关注