时序差分算法相关硕士博士期刊学术论文

针对锅炉过热汽温模型结构和参数发生较大变化时常规PID控制效果难以令人满意的问题，提出一款基于actor-critic（AC）强化学习（reinforce......

期刊

文章介绍了加强学习模型，分别给出了加强学习的四个主要算法：动态规划、蒙特卡罗算法、时序差分算法、Q－学习，并指出了它们之间的区别......

期刊

在未来的战场中,智能导弹将成为精确有效的打击武器,导弹智能化已成为一种主要的发展趋势。本文以传统的比例制导律为基础,提出基......

期刊

文章介绍了加强学习模型,分别给出了加强学习的四个主要算法:动态规划、蒙特卡罗算法、时序差分算法、Q-学习,并指出了它们之间的......

期刊