激励学习算法相关论文
SARSA(λ)和Q学习算法是两类最重要的激励学习算法。该文结合一些已有算法,提出了一个新的激励学习算法,称为PW-SARSA(λ)算法。通过......
文中利用求解最优费用函数的方法给出了一种新的激励学习算法 ,即基于每阶段平均费用最优的激励学习算法。这种学习算法是求解信息......