论文部分内容阅读
本文研究了一类线性二次二人零和随机微分对策问题(简称SLQG),主要目的是对其开环和闭环鞍点进行刻画与比较.本文中,状态方程是非齐次的,决策者采取的控制允许出现在状态方程的漂移项和扩散项中,性能指标中的加权矩阵可以是不定的或奇异的,状态过程与控制过程的交叉项,两个控制过程的交叉项,以及状态过程、控制过程的一阶项允许出现在性能指标中.根据时间区间的不同,我们对有限时区和无穷时区的情形分别进行了讨论.对有限时区的SLQG问题,状态方程中的系数矩阵可以是无界的,性能指标带有终端惩罚.在适当条件下,我们得到状态方程的解的存在唯一性.对于开环鞍点,我们利用变分的方法,证明了开环鞍点存在当且仅当某个带有约束条件的正倒向随机微分方程(简称FBSDE)存在适应解,且某种凸-凹性条件成立.进步,我们讨论了开环上下值函数与开环鞍点的关系.对一类确定性的线性二次二人零和微分对策问题,Zhang [SIAM J. Control Optim.,2005,43:2157-2165]证明了开环上下值函数的有限性与开环鞍点的存在性之间的等价性.这一结果在一般情形下并不成立,我们得到一个较弱的结论:开环上下值函数的有限性蕴含着凸-凹性条件成立.对于闭环鞍点,我们利用解耦的方法,诱导出Riccati微分方程,证明了闭环鞍点的存在性与Riccati微分方程的正则解的存在性等价,并给出了闭环鞍点及值函数的表达式Riccati微分方程可能存在多个解,但正则解是唯一的.通过比较开环和闭环鞍点的特征我们发现,对于闭环鞍点的存在性,凸-凹性条件不是必要的,因此闭环鞍点存在不能导致开环鞍点存在,然而却可以诱导出带有约束条件的FBSDE的适应解的存在性;另一方面,Riccati微分方程解的正则性这一要求则使得开环鞍点的存在性也不能蕴含闭环鞍点的存在性.另外,对线性二次随机最优控制问题而言,闭环最优策略存在将导致开环最优控制存在.前面指出,闭环鞍点的存在性不能蕴含开环鞍点的存在性,因此,这一点使我们只能将线性二次随机最优控制问题形式上看作是问题SLQG的特例.对无穷时区的SLQG问题,我们假设状态方程的系数矩阵和性能指标中的加权矩阵为常值矩阵.作为关键步骤,我们首先证明了,在较为温和的条件下,一类无穷时区上的线性随机微分方程/倒向随机微分方程存在唯一平方可积解/适应解.对于开环鞍点,当状态方程的系数矩阵满足一定条件时,我们有类似于有限时区情形的结论.不同的地方在于此时的FBSDE是定义在无穷区间上的,需要讨论其L2-稳定适应解的存在性.对于闭环鞍点,我们引入代数Riccati方程(简称ARE)及其稳定化解的概念,并利用矩阵不等式的方法证明了闭环鞍点的存在性等价于相应的ARE的稳定化解的存在性.进一步,我们给出了闭环鞍点及值函数的表达式.本文首先回顾了微分对策,特别是二人零和微分对策的历史发展及其研究现状.然后讨论有限/无限区间上线性随机微分方程和倒向随机微分方程的适定性.接下来,分别对有限时区和无穷时区的SLQG问题进行讨论,得到开环和闭环鞍点的刻画,并给出一些例子来阐释相应的结果.最后,我们对文章进行总结并介绍一些相关问题.