论文部分内容阅读
近几十年来,随机非线性系统的研究一直是控制理论界的热点与难点之一。随机非线性系统的风险灵敏度控制是其中需要解决的重要理论问题,也是该领域的前沿课题。自从积分反推方法出现以来,给随机非线性系统的研究带来了一种通用的、系统的构造性迭代工具,可以获得系统的控制器的显式的、可实现的表达形式,实现了从理论分析向控制器设计的重要转折,使得对随机非线性系统的研究更具有现实意义。
与状态反馈控制相比,输出反馈(或称为非完全状态)控制无论从理论上还是实际运用中,都具有更为重要的意义,但同时也带来了更多的复杂性与更大的挑战性。本文主要研究了风险灵敏度性能指标下的随机非线性系统输出反馈控制问题中的几个主题,包括基于信息状态的随机系统最优输出反馈控制的研究、具有严格反馈形式的随机非线性系统的输出反馈控制设计以及随机非线性系统的自适应跟踪系统的研究。
针对部分可观测随机系统在风险灵敏度指标下的最优输出反馈控制问题,通过引入信息状态概念来获得输出反馈控制律。与以往的研究不同,由于考虑了系统状态和系统的输出(测量)噪声之间也存在着相关系数的情况,原先的设计方法会变得无效。本文通过适当的测度空间变换以及运用完全平方的方法,将原先的部分观测问题转换为一个完全信息状态问题,获得了一种更为直接求解该系统信息状态的显示表达式的方法。在此基础上,进一步研究了在给定的带有一般二次项形式(带有交叉项及额外的线性项)的风险灵敏度性能指标下的随机系统最优输出反馈控制问题,利用新给出的信息状态求解方法,将原先的部分可观测系统的控制问题转化为等价的完全可观测系统的最优控制问题,在新的测度空间中,使用传统方法加以解决,获得最优输出反馈控制律的显式解,并将该结论推广至无限时域情况。
应用积分反推方法,在无限时区风险灵敏度指标下,针对一类严格反馈随机非线性系统的输出反馈风险灵敏度控制问题,基于更为一般的值函数形式,给出了控制器设计的构造方法并得到了输出反馈控制器的显式形式,扩展了以往研究中值函数构造可行范围,给控制器设计带来了更大的灵活性,所设计的控制器能够满足任意给定的风险灵敏度风险指标,并且保证整个闭环系统是概率意义下有界的。当扰动向量场在原点处消逝时,所设计的反馈控制器还能保证零风险灵敏度指标,并能保证闭环系统概率意义下的渐近稳定性。特别地,利用该方法所设计的控制器还能保证其平衡性条件。
随机非线性系统的自适应跟踪问题在以往的研究中很少涉及,针对在给定的风险灵敏度性能指标下,具有未知参数的随机系统自适应跟踪控制问题,通过对未知参数的属性分析,对于未知常参数以及一般的未知参数的情况,有针对性地分别设计了观测器,充分利用了未知参数的己知信息。利用积分反推方法获得了相应的输出反馈控制律以及自适应参数更新律,可以保证整个闭环系统的跟踪效果达到了给定的性能指标,同时系统在概率意义下有界的。仿真结果验证了这两种设计方法的正确性和有效性。通过对常数信号以及正弦信号的跟踪模拟,可以看到设计的控制器不仅能保证整个系统对给定信号的跟踪效果,而且当被跟踪信号发生变化时,系统也能很快响应,通过不同的设计参数调整,可以获得满意的跟踪效果。
进一步,对带有观测噪声并且初始状态不确定的随机系统的自适应跟踪控制进行了研究。系统不仅带有未知参数,同时系统状态和输出/观测噪声之间并不相互独立,代表了更为一般的实际系统模型。运用信息状态控制方法,通过对增广系统变换,将原先的部分可观测(非完全信息状态)系统转化为完全等价的完全可观测系统,并获得在新测度空间中的等价系统与性能指标表达方程,在此基础上运用积分反推方法来获得该类系统的自适应跟踪控制器。对比以往的结果可以看到系统初始状态不确定性的分布情况将直接影响最终性能指标的结果。仿真结果表明,运用该方法可以很好地解决此类跟踪问题,设计出的观测器可以很好地表达新测度空间中的状态量,这也是将信息状态方法引入研究的重要原因之一,所设计出的控制器能够使系统达到预期的跟踪效果,在满足给定的风险灵敏度性能指标的同时保证整个闭环系统在概率意义下有界。