论文部分内容阅读
倒立摆控制系统是一种不稳定,高阶,多变量,强耦合的非线性系统。传统的控制方法,如PID控制,控制效果一般。在本文中,我们将强化学习用于倒立摆系统的控制,采用基于模型和不基于模型的两类方法进行仿真实验。并且与最优控制方法线性二次调节器(LQR)方法进行了对比。实验结果表明,在非线性复杂系统的控制上,强化学习算法在控制稳定性和准确性上都有明显的优势。