论文部分内容阅读
因为时滞非线性系统最优控制解的解析形式很难求得,所以时滞非线性系统最优控制一直是控制领域研究的热点和难点之一.另一方面,自适应动态规划(ADP)作为一种近似求解最优控制问题的新算法,自从诞生之日起就一直被认为是解决非线性系统最优控制的有效方法之一.自适应动态规划成功地结合了神经网络、自适应评判设计、加强学习和经典动态规划等理论,在求解非线性系统最优控制时有效地避免了“维数灾”问题,因而获得广泛的关注.因此,深入地探讨自适应动态规划理论及其算法,对解决时滞非线性系统的最优控制问题有着重要的理论意义和应用价值.本文基于自适应动态规划理论与算法,对时滞非线性系统的最优镇定控制、最优跟踪控制、有限时间最优控制问题等进行了深入地研究,取得了如下创新性成果:1.针对一类带有饱和执行器的时滞非线性系统,提出了一种局部寻优和全局寻优相结合的最优反馈控制方案.该方案引入非二次型的性能指标函数,采用ADP算法得到了最优控制策略.两个神经网络分别用来近似性能指标函数和控制策略.给出的定理证明了所提出的ADP算法的收敛性.2.首次应用启发式动态规划(HDP)迭代算法解决了时滞非线性离散系统的最优跟踪控制问题,并且提出了-种包含状态迭代,控制律迭代和性能指标迭代的HDP迭代算法.利用Lyapunov理论证明了所得到的控制能够使得系统渐近跟踪上给定的期望轨迹.3.针对一类离散时滞系统提出了一个基于回声状态网(ESNs)的迭代二次启发式规划(DHP)算法.在每次迭代中,ESNs被用来近似协状态函数.为了保证ESNs近似器的可靠性,ESNs的均方误差被限定在一定的范围内.给出的定理证明了协状态函数的有界性,并且指出如果系统渐近稳定,则协状态函数收敛到零.4.针对仿射时滞非线性系统提出了一种新的有限时域最优控制方法.证明了当迭代步数增长到无穷时,迭代算法收敛.同时指出性能指标函数的极限满足离散时间HJB方程,且有限时域迭代算法可以达到理想的误差范围内.5.针对非仿射非线性时滞系统,提出了一种有限时间最优控制方案.该方案考虑了两种不同的初始情况,并分别给出了相应的控制算法.证明了在不同初始情况下算法的收敛性,而且给出了系统运行时间步数的表达式.6.针对非线性时滞系统提出了一种有限时间最优跟踪控制方法.该方法基于自适应动态规划理论,能够使得时滞非线性系统在N步内跟踪上一个时不变轨迹.首先最优跟踪问题被转化成了一个调节问题,定义的代价函数保证了系统跟踪能量最小.其次,应用有限时间自适应动态规划方法提出了最优N步控制方案.最后给出的定理证明了所提出算法的收敛性.