论文部分内容阅读
维纳的《控制论》和钱学森的《工程控制论》共同奠定了经典控制理论的基础。在此基础之上,现代控制理论在性能优化和处理不确定性等方面对经典控制理论作了进一步的发展。本文提出一种融合经典控制与现代控制的控制方法,将属于现代控制的近似动态规划学习控制器以并联的方式附加到经典控制器上,从而形成一类新型附加学习控制器。该控制器采用基于策略迭代近似动态规划的训练算法和基于最小二乘的代价函数逼近算法,从而具有高策略搜索效率和高样本利用效率,其中动作依赖代价函数的引入使得在线学习不依赖系统模型。总之,所提附加学习控制器一方面