平均场情形下的状态受限问题的随机最大值原理

来源 :山东大学 | 被引量 : 0次 | 上传用户:kick3160288
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究了两类状态受限平均场随机控制问题的最大值原理:控制系统为解耦的平均场正倒向随机微分方程时的状态受限随机最大值原理和完全耦合时的状态受限平均场随机最大值原理。主要应用随机微分方程、随机最大值原理、平均场倒向随机微分方程等理论。  首先,我们研究了如下形式的状态受限的平均场随机控制的最大值原理,考虑如下的控制系统:{dx(t)=b(t,x(t),E[x(t)],u(t))dt+σ(t,x(t),E[x(t)],u(t))dBt,x(0)=a,dy(t)=-(g)(t,x(t),y(t),z(t),E[x(t)],E[y(t)],E[z(t)],u(t))dt+z(t)dBt,y(T)=h(x(T),Ex(T)).(1)  代价泛函为:J(u(·))=E[∫0T(l)(t,x(t),y(t),z(t),Ex(t),Ey(t),Ez(t),u(t))dt]+E[ψ(x(T),Ex(T))]+γ(y(0)),  其中,系数满足如下假设:  (1)b,σ,(g),h,(l),ψ,γ连续并关于(x,y,z,(x),(y),(z),u)连续可微;  (2)b,σ,(g)和h关于(x,y,z,(x),(y),(z),u)的导数有界;  (3)(l)关于(x,y,z,(x),(y),u)的导数被C(1+|x|+|y|+|z|+|(x)|+|(y)|+|(z)|+|u|)控制住,ψ,γ的导数被C(1+|x|+|(x)|)控制住。  方程(1)中的正向方程的终端x(T)控制在一个凸闭集中,我们的目标是获得当代价泛函达到最小时,最优控制应该满足的条件。主要思想是利用等价变换的方法,将状态受限的问题转化为控制受限的问题。然后利用Ekeland变分原理和伴随方程给出最大值原理的必要条件。  然后我们研究了如下的完全耦合的状态受限的平均场随机控制的最大值原理。  首先,我们考虑如下的完全耦合平均场正倒向随机微分方程:{ dx(t)=(b)(t,θ(t))dt+(σ)(t,θ(t))dBt,dy(t)=-(g)(t,θ(t))dt+z(t)dBt,(2)x(0)=a,y(T)=Φ(x(T),Ex(T)),t∈[0,T],其中:θ(t)=(x(t),y(t),z(t),E[x(t)],E[y(t)],E[z(t)])。  当系数满足Lipschitz条件、可积条件和单调性条件时:{(1)≤-β1|(x)|2-β2(|(y)|2+|(z)|2),(2)<Φ(x1,(x))-Φ(x2,(x)),G(x1-x2)>≥μ1|(x)|2.方程(2)存在唯一解。  其次,考虑如下的状态受限的平均场随机控制系统,{ dx(t)=b(t,θ(t),u(t))dt+σ(t,θ(t),u(t))dBt,dy(t)=-(g)(t,θ(t),u(t))dt+z(t)dBt,(3)x(0)=a,y(T)=h(x(T),Ex(T)),t∈[0,T],其中θ(t)=(x(t),y(t),z(t),E[x(t)],E[y(t)],E[z(t)]),u(t)∈ad为控制,正向方程的终端x(T)控制在凸闭集中。  类似地,我们利用等价变换和Ekeland变分原理得到该种情形下的最大值原理的必要条件。
其他文献
近三十年来,Banach空间几何理论作为Banach空间理论的重要内容之一被许多专家学者广泛研究,但是作为Banach空间直接推广的n-Banach空间理论的发展却相对缓慢.众所周知,Banach空
科学与工程的许多问题具有散逸性,即系统具有一个有界吸引集,从任意初始条件出发的解经过有限时间后进入该吸引集并随后保持在里面。散逸性研究一直是动力系统研究中的重要课题
在逻辑推理系统和逻辑代数系统的研究中,理想和滤子是两个重要的概念和工具.本文在剩余格上引入*-运算并使用代数工具和拓扑学方法,对正则剩余格上的与*-运算有关的各种理想进
本文从以下几个方面讨论: 1.简述非线性泛函分析理论的历史背景和研究现状. 2.在一致凸Banach空间中介绍了一种新的有限个渐近非自非扩张映射的带有误差的Ishikawa迭代算法
本论文讨论了带有饱和控制的非线性离散奇异系统的稳定性和H∞控制问题,非线性满足增益有界约束条件。用凸包的方法把非线性饱和控制项,转换为可以直接用Matlab软件包求解的线
本文旨在研究在给定的非Lipschitz条件下,如下所示多维平均场倒向随机微分方程解的存在唯一性及相应的比较定理:Yt=ξ+∫Tt E[f(s,Ys,Zs,Ys,Zs)]ds-∫Tt Zs· dBs,0≤t≤T,(1)其中