论文部分内容阅读
本文主要研究了两类状态受限平均场随机控制问题的最大值原理:控制系统为解耦的平均场正倒向随机微分方程时的状态受限随机最大值原理和完全耦合时的状态受限平均场随机最大值原理。主要应用随机微分方程、随机最大值原理、平均场倒向随机微分方程等理论。 首先,我们研究了如下形式的状态受限的平均场随机控制的最大值原理,考虑如下的控制系统:{dx(t)=b(t,x(t),E[x(t)],u(t))dt+σ(t,x(t),E[x(t)],u(t))dBt,x(0)=a,dy(t)=-(g)(t,x(t),y(t),z(t),E[x(t)],E[y(t)],E[z(t)],u(t))dt+z(t)dBt,y(T)=h(x(T),Ex(T)).(1) 代价泛函为:J(u(·))=E[∫0T(l)(t,x(t),y(t),z(t),Ex(t),Ey(t),Ez(t),u(t))dt]+E[ψ(x(T),Ex(T))]+γ(y(0)), 其中,系数满足如下假设: (1)b,σ,(g),h,(l),ψ,γ连续并关于(x,y,z,(x),(y),(z),u)连续可微; (2)b,σ,(g)和h关于(x,y,z,(x),(y),(z),u)的导数有界; (3)(l)关于(x,y,z,(x),(y),u)的导数被C(1+|x|+|y|+|z|+|(x)|+|(y)|+|(z)|+|u|)控制住,ψ,γ的导数被C(1+|x|+|(x)|)控制住。 方程(1)中的正向方程的终端x(T)控制在一个凸闭集中,我们的目标是获得当代价泛函达到最小时,最优控制应该满足的条件。主要思想是利用等价变换的方法,将状态受限的问题转化为控制受限的问题。然后利用Ekeland变分原理和伴随方程给出最大值原理的必要条件。 然后我们研究了如下的完全耦合的状态受限的平均场随机控制的最大值原理。 首先,我们考虑如下的完全耦合平均场正倒向随机微分方程:{ dx(t)=(b)(t,θ(t))dt+(σ)(t,θ(t))dBt,dy(t)=-(g)(t,θ(t))dt+z(t)dBt,(2)x(0)=a,y(T)=Φ(x(T),Ex(T)),t∈[0,T],其中:θ(t)=(x(t),y(t),z(t),E[x(t)],E[y(t)],E[z(t)])。 当系数满足Lipschitz条件、可积条件和单调性条件时:{(1)≤-β1|(x)|2-β2(|(y)|2+|(z)|2),(2)<Φ(x1,(x))-Φ(x2,(x)),G(x1-x2)>≥μ1|(x)|2.方程(2)存在唯一解。 其次,考虑如下的状态受限的平均场随机控制系统,{ dx(t)=b(t,θ(t),u(t))dt+σ(t,θ(t),u(t))dBt,dy(t)=-(g)(t,θ(t),u(t))dt+z(t)dBt,(3)x(0)=a,y(T)=h(x(T),Ex(T)),t∈[0,T],其中θ(t)=(x(t),y(t),z(t),E[x(t)],E[y(t)],E[z(t)]),u(t)∈ad为控制,正向方程的终端x(T)控制在凸闭集中。 类似地,我们利用等价变换和Ekeland变分原理得到该种情形下的最大值原理的必要条件。