平均报酬模型相关论文
随着多移动机器人系统的应用越来越向未知领域如医学领域、深海探测和航空航天领域等方向发展,在未知环境下解决避障路径规划问题......
讨论模型未知的平均报酬强化学习算法。通过结合即时差分学习与R学习算法,将折扣问题中的一些方法推广到了平均准则问题中,提出了两类......
提出了一种新颖的基于平均报酬模型的全过程R(λ)学习互联电力系统CPS最优控制方法。该方法与电网自动发电控制(AGC)追求较高的考......
1997年NERC正式推出了联络线功率与系统频率偏差模式下互联电网自动发电控制(Automation Generation Control, AGC)的控制性能标准......