论文部分内容阅读
在控制工程实践中,存在着大量的非线性系统的最优控制问题。自适应动态规划(Adaptive Dynamic Programming,ADP)作为一种近似求解非线性最优控制问题的新方法,融合了神经网络、动态规划和强化学习的思想,有效的克服了“维数灾”的问题,并且能够获得近似最优的闭环反馈控制律,可用于复杂生产过程系统的优化控制设计。然而,自适应动态规划方法体系还未完善,利用自适应动态规划方法研究非线性系统最优控制的许多理论与技术问题还有待解决。本文基于自适应动态规划方法研究了在模型未知和存在外界干扰情况下的非线性系统的最优控制问题,并将自适应动态规划方法成功的应用于煤化工生产过程控制中,取得了很好的控制效果。本文的主要工作和贡献体现在以下四个方面。
1.研究离散时间下模型完全未知的非线性系统,利用贪婪迭代启发式动态规划(HDP)方法,设计神经网络最优控制器,实现了系统的最优跟踪控制。首先通过构造神经网络辨识器来学习未知系统的动态特性,同时建立前馈控制器来产生系统稳态跟踪控制;然后利用系统变换,将最优跟踪控制问题转化为最优误差调节器设计问题,进而引入贪婪迭代HDP算法得到系统的最优反馈控制律,并对迭代算法的收敛性进行证明;最后进行仿真实验,仿真结果表明基于贪婪迭代HDP的神经网络控制器是有效的。
2.考虑有外界干扰情况下,针对离散非线性系统,设计基于GHJI(Generalized Hamilton-Jacobi-Isaacs)和神经网络的H∞跟踪控制器,解决了存在外界干扰条件下的非线性系统的跟踪控制问题。首先通过系统变换,将跟踪控制问题转化为误差调节器设计问题;然后建立系统的GHJI方程,设计近似最优迭代算法求解最优控制策略,并对迭代算法的收敛性和控制系统的稳定性进行了证明;最后利用神经网络实现H∞最优跟踪控制器,并通过仿真实验说明该方法是可行且有效的。
3.针对连续时间下未知的非线性系统,基于神经网络观测器,利用自适应动态规划方法设计神经网络控制器,解决了连续非线性系统的最优控制问题。首先为了得到系统的状态信息,构造神经网络观测器,并给出观测器稳定性的证明方法;然后利用自适应动态规划方法,建立系统的最优控制器,同时分析了包含神经网络观测器和控制器的整个闭环系统的稳定性,并给出相关证明方法。最后进行仿真实验,仿真结果表明该方法有效的解决了未知的连续非线性系统的最优控制问题。
4.研究自适应动态规划方法在煤制甲醇变换单元温度控制中的应用。首先,我们利用机理分析建模方法和神经网络建模方法,分别对系统进行建模;然后,通过设置关键过程参数的评价函数,将机理模型和神经网络模型相结合,进而能够根据不同工况条件来实时调整神经网络模型,使得其更加接近实际系统的动态特性。在建模完成之后,利用双启发式动态规划方法,建立神经网络温度控制器。最后进行仿真实验,仿真结果表明基于双启发式动态规划的温度控制器是可行的,实现了变换炉触媒层温度的最优控制。