论文部分内容阅读
本文主要研究时滞系统的控制问题,分别针对输入时滞伊藤系统的二次优化控制问题、通信时滞多自主体系统的趋同问题、输入时滞多自主体系统趋同的时滞界问题以及输入时滞系统多目标优化控制问题进行了深入研究.主要学术贡献包括:首次得到输入时滞随机最优控制问题存在唯一解的充分必要条件及系统均方可稳的充要条件,给出了不同于传统控制理论的控制器设计方法;解释了被广泛采用的多自主体系统趋同协议的数学来源依据,得到多自主体系统可趋同所容许的最大时滞界;得到:Stackelberg博弈控制策略存在唯一的充分必要条件,并基于对称、解耦的Riccati方程设计控制器,本质性的改进了过去基于非对称、耦合Riccati方程设计控制策略的理论,并将结果推广到时滞博弈控制中.主要学术创新点包括:提出一类随机正倒向时滞微分方程求解理论方法,建立随机控制状态与伴随状态显式解析表达关系,由此得到时滞系统随机控制存在唯一解的充要条件及系统均方可稳的充要条件;将随机逼近理论以及时滞系统控制理论应用于多自主体系统趋同问题,研究趋同协议由来依据、趋同速度、通信时滞系统趋同、趋同可容许最大输入时滞界;引入新伴随状态和新状态变量,研究时滞博弈控制.具体研究内容、研究结果和创新按照章节顺序叙述如下:1.研究输入时滞伊藤系统的二次最优控制问题.利用变分法,给出随机极大值原理的一个新颖直观的推导证明.基于极大值原理,建立最优伴随状态和状态之间的非齐次线性关系,得到控制问题存在唯一解的充要条件.结合完全配方法,通过求解Riccati方程和线性偏微分方程得到显式的最优解.进一步,针对无限时间随机优化控制问题,得到了系统均方可稳的充要条件以及显式的最优控制器.所得结果在控制器设计等方面突破了传统控制理论方法,其创新点是随机正倒向时滞方程求解理论,即最优伴随状态与状态之间线性非齐次关系的建立,为分布式时滞随机控制的研究奠定了理论基础.2.应用随机系统理论和时滞控制方法研究具有通信噪声、通信时滞和丢包情形下多自主体系统的趋同问题.·针对具有通信噪声的情形,基于随机逼近理论,首先给出了分布式控制协议的数学解释.进而结合随机逼近理论的鞅方法,得到了系统强趋同的充分条件.特别地,采用鞅不等式技术,对通信过程出现相关噪声的系统也给出了强趋同的充分条件.·针对既含噪声又有时滞的情形,通过对系统变量进行转换,将均方趋同问题等价为一个均方稳定性问题.利用时滞系统理论、Schwarz不等式、数学归纳法得到了系统的均方趋同的充分条件.进一步将这一结果推广到通信丢包情形,得到强趋同条件.特别需要指出的是,针对以上研究内容,我们都给出了与趋同算法的步长因子密切相关的收敛速度分析.主要创新在于将随机逼近理论应用到多自主体趋同研究中,得到了相关噪声、时滞以及丢包情形下趋同的条件,并且分析了收敛速度.3.研究输入时滞多自主体系统趋同的时滞界问题.采用标准的控制协议,将已有的时滞系统稳定的最大时滞界理论方法推广到多个单自主体系统同时稳定的问题.对于连续系统,得到了系统可趋同的最大时滞界;针对离散系统,给出了系统趋同允许的最大时滞界严格非零的充要条件.主要创新是:给出趋同允许的最大时滞界.此外,与已有文献主要针对开环临界稳定的时滞系统不同的是,我们首次研究了具有开环不稳定极点的输入时滞多自主体系统.4.应用最优控制理论和时滞系统理论研究Stackelberg博弈问题,包括无时滞博弈和时滞博弈两种情形.对于无时滞Stackelberg博弈问题,通过引入两个新的伴随状态来刻画领导者将来的控制信息,给出了最优解存在且唯一的充要条件,并得到基于三个解耦、对称Riccati方程的最优Stackelberg策略显式解.对于时滞Stackelberg博弈问题,通过构造引入一个新的状态变量来刻画历史的领导者和跟随者控制信息,由此消除了时滞导致的最优控制非因果性,进而得到了时滞博弈问题最优解存在唯一的充要条件以及基于三个解耦、对称Riccati方程的显式最优策略.关键创新是新伴随状态变量和新状态变量的引入,通过这些变量的引入将平衡条件中的信息区分成历史信息、当前信息、将来信息,由此得到最优博弈策略存在唯一解的条件.这些结果完善和改进了领导者-跟随者博弈Stackelberg策略理论.