平均报酬强化学习相关硕士博士期刊学术论文 - 搜论网

平均报酬强化学习相关论文

基于平均报酬模型的强化学习算法研究

对于有吸收目标状态的循环任务，比较合理的方法是采用基于平均报酬模型的强化学习．平均报酬模型强化学习具有收敛速度快、鲁棒性强等......

期刊

平均报酬强化学习 R学习 H学习 LC学习

平均报酬模型强化学习理论、算法及应用

折扣报酬模型强化学习是目前强化学习研究的主流,但折扣因子的选取使得近期期望报酬的影响大于远期期望报酬的影响,而有时候较大远......

期刊

平均报酬强化学习 R学习 H学习

看过本文同时还关注