论文部分内容阅读
多自主体中的微分博弈问题,也就是微分图博弈问题,将多自主体的协同控制理论与微分博弈理论相结合,研究多自主体系统在形成群集协同的过程中对自身的性能指标进行优化的问题。其在军事对抗、经济、电力系统、生物学等方面有着较强的应用前景,特别是信息对抗方面,能够优化无人机在编队过程中的能量损耗。因此,本文就多自主体群集协同中的微分博弈问题进行了研究,主要内容如下: 首先,研究了带对抗输入的异构多自主体系统完全同步中的微分博弈问题。考虑到系统的异构性,构建了形式相同的扩展误差系统,结合性能指标将同步问题转化成一个零和微分图博弈问题,而上述问题可以归结为求解耦合Hamilton-Jacobi-Isaacs(HJI)方程。本文提出一个异构系统策略迭代算法来近似获得耦合HJI方程的解,算法的收敛性也得到了证明。 接着,研究了系统参数部分未知下多自主体簇同步中的微分博弈问题,本章的目标是设计控制器实现多自主体的簇同步并保证性能指标的局部最优性。在给出簇跟踪误差的定义和Nash均衡的概念之后,先前的问题可以转化成解耦合Hamilton-Jacobi-Bellman(HJB)方程的问题。为了解这个问题,本文提出了一个基于数据的策略迭代算法,运用了执行器-评价器神经网络的去得到部分参数未知下的HJB方程的近似解,算法的收敛性也给出了证明。 然后,研究了多自主体编队包围中的微分博弈问题。为了让领导者实现编队而跟随者跟踪到领导者的包围中,构建了领导者-跟随者两层局部邻居误差系统,设计控制器使得误差系统稳定且达到Stackelberg均衡,就能将该问题转化成一个分层非零和微分博弈问题,而分层非零和微分博弈问题归结为解分层耦合HJB方程。本文提出了一个分层策略迭代算法来近似获得分层耦合HJB方程的解,每次迭代中领导者层都先于跟随者层进行策略评估和更新,同样也证明了算法的收敛性。 最后,总结了论文的主要内容并对未来的工作进行了展望。