平均场正倒向随机微分方程及相关的最优控制、微分对策问题

来源 :山东大学 | 被引量 : 0次 | 上传用户:xuming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
平均场随机微分方程,也称为McKean-Vlasov方程,在很多领域都有广泛的应用,像统计力学,物理学,量子力学和量子化学。Lasry和Lions[57]最近的一系列文章更是将这类方程的应用领域拓展到经济、金融和对策理论。随着平均场随机微分方程理论的发展,特别是最近几年,很多学者对McKean-Vlasov类型偏微分方程产生了极大的兴趣,并尝试用随机的方式对其进行研究。当随机系统的规模非常庞大时,通过刻画由大量随机微粒构成的系统的渐进行为来描述这些系统。受Lasry和Lions[57]工作的启发,Buckdahn, Djehiche, Li和Peng[17]利用纯随机的方法,在研究一类特殊的平均场问题时,得到了一类新的倒向随机微分方程—平均场倒向随机微分方程。随后,在2009年,Buckdahn, Li和Peng[20]证明了在Lipschitz条件下平均场倒向随机微分方程的解存在唯一,并给出相关非局部拟线性偏微分方程的概率解释。后面的两项工作吸引了许多学者来研究平均场框架下的随机微分方程理论,大量的平均场框架下关于正倒向随机微分方程理论和应用方面的工作不断涌现。另一个方面,自从Bellman[6]提出动态规划方法以来,这种方法便成为研究随机控制问题的一个主要工具。它建立起随机微分方程与偏微分方程之间关系,为给出相关偏微分方程的概率解释提供了可能。但是平均场情形下,研究正倒向随机微分方程的最优控制及微分对策问题时,一个直接的技术困难是动态规划原理不再成立。为此,我们不得不固定零时刻的参数,通过研究以下新类型的正倒向随机微分方程来克服这一困难:和值函数耦合的倒向随机微分方程;对策中和上、下值函数耦合的倒向随机微分方程;涉及值函数的完全耦合的正倒向随机微分方程;以及涉及值函数的一般的完全耦合的正倒向随机微分方程。在2013年,法国科学院院士Fields奖获得者P.L. Lions在College de France的一系列讲座(或者参考Cardaliaguet[23]编写的课堂笔记)将平均场问题的研究工作推向了一个新的高度。P.L. Lions在讲座中指出可以通过研究函数f(ξ):=f(Pξ)关于ξ的Frechet导数,来研究定义在测度空间792(Rn)上的函数.f:7)2(Rn)→R关于测度的导数。受这一思想启发,Carmona和Delarue[27],[28]研究了人口数量较大的均衡主方程和正倒向随机微分方程,及受控的McKean-Vlasov方程。Cardaliaguet[24]应用变差方法证明了局部耦合的一阶平均场对策系统的一个弱解的存在唯一性。特别值得一提的是,Buckdahn, Li, Peng和Rainer[21]考虑由布朗运动驱动的一般情形下的平均场随机微分方程,此时方程的系数不仅依赖于解,同时也依赖于解的分布。证明了由方程的解定义的值函数是一个涉及分布的非局部偏微分方程的唯一的经典解。基于Buckdahn, Li, Peng和Rainer[21]的工作,本文第六章考虑了带跳的平均场随机微分方程,并给出了相关的偏微分方程的概率解释。本论文主要研究了两方面的内容:一、在固定零时刻初始值和控制的条件下,研究平均场倒向随机微分方程的最优控制问题和微分对策问题、(一般的)完全耦合的平均场正倒向随机微分方程的最优控制问题;二、研究一般情况下带跳的平均场随机微分方程,以及相关的非局部偏微分方程的概率解释。下面更加详细地阐述本论文的内容及结构。第一章介绍第二章到第六章中所研究的问题。第二章主要研究了,在固定零时刻初始值及控制的情况下,平均场倒向随机微分方程的最优控制问题。一类新的倒向随机微分方程,称为和值函数耦合的倒向随机微分方程被考虑。首先,使用一种新的迭代方法,证明了在Lipschitz条件下这类倒向随机微分方程的解存在唯一。当系数f关于y’单调非减时,经典的倒向随机微分方程的比较定理允许证明这类新方程的比较定理。由于固定了零时刻初始值及控制,动态规划原理仍然成立。不同于Peng[80]介绍的倒向半群方法,这里使用一种新的、更加直接的方法证明了非局部HJB方程粘性解的存在唯一性。本章的主要创新点:1.提出了通过引进一类新的倒向随机微分方程—和值函数耦合的倒向随机微分方程,来解决平均场框架下动态规划原理通常不成立的方法;2.一旦知道了和值函数耦合的倒向随机微分方程的解(Yt,x,v,Zt,x,v,W(t,x)),通过定义新的系数,这里所研究的最优控制问题将会变成经典情况下的最优控制问题。因此,利用一种新的,更加直接的方法,证明了相关非局部HJB方程粘性解的存在唯一性。本章来自于:Hao, T., Li, J., Backward stochastic differential equations coupled with value func-tion and related optimal control problems. Abstract and Applied Analysis, Volume 2014, article ID 262713,17 pages, http://dx.doi.org/10.1155/2014/262713.第三章主要考虑平均场框架下,受控的倒向随机微分方程的随机微分对策问题。受第二章工作的启发,引进了一类和上、下值函数耦合的受控倒向随机微分方程,证明了这类方程的解存在唯一。通过该方程的解定义了上、下值函数,利用Grisanov变换,证明了这两个值函数是确定性的。本章的第二个主要工作是研究与这类受控方程相关联的两个非局部HJB-Isaacs方程。由于系数中含有期望项,不同于经典情况下Buckdahn和Li[18]的工作,这里所研究的两个HJB-Isaacs方程是耦合的。这一对组合(W,U)在至多满足多项式增长的函数空间Θ×Θ中是相关的耦合的HJB-Isaacs方程的唯一粘性解。本章的最后给出了Isaacs条件,在Isaacs条件下上述对策问题的值函数存在。本章来自于:Hao, T., Li, J., BSDEs in games, coupled with the value functions. Associated non-local Bellman-Isaacs Equations,已投稿。第四章主要用来给出平均场框架下,与涉及值函数的完全耦合的正倒向随机微分方程系统,相关联的非局部HJB方程的概率解释。我们起初考虑的是,平均场框架下完全耦合的正倒向随机微分系统的最优控制问题,但是遇到了和[41]一样的技术障碍。因此,采用[41]介绍的方法,即,通过引进涉及值函数的完全耦合的正倒向随机微分方程,并用迭代方法证明其解的存在唯一性。但是这里所面临的一个主要困难是处理完全耦合的正倒向随机微分方程:任何的迭代过程都会涉及正向方程的解Xt,x;v,i,和带有(X0,x0;v,i)’的变量Wi-1。这意味着,按照[41]介绍的方法,得到的四个序列{X0,x0;v,i}, {Xt,x;v,i},{Yi,x;v,i},{Zt,x;v,i}和相关的Wi+1(t,x)=essinf Yt t,x;v,i v∈Vt,T不再收敛。这里采用一种新的方法证明了迭代过程的收敛性。基于Li和Wei[63]的工作,使用一种简短的,更加直接的方法证明了,通过这类新的方程的解定义的值函数W是相关非局部HJB方程的粘性解。本章的主要创新点:使用一种新方法证明了迭代序列的收敛性,从而证明了涉及值函数的完全耦合的正倒向随机微分方程解的存在性,并给出了相关的平均场类型的HJB方程的概率解释。本章来自于:Hao, T., Li, J., Fully coupled forward-backward SDEs involving the value function and associated nonlocal Hamilton-Jacobi-Bellman equations, ESAIM:Control, Optimi-sation and Calculus of Variations,22(2) (2016), pp.519-538.第五章主要是将第四章的工作推广到更加一般的情况,具体的说,在第四章中,正向方程的系数σ依赖于控制v,但是不依赖于z;但是在本章中,系数σ不仅依赖于控制v,而且还依赖于z,称这种新的正倒向随机微分方程为,涉及值函数的一般的完全耦合的正倒向随机微分方程。证明了这类方程的解存在唯一。由于扩散系数σ含有变量z,类似于Wu和Yu[94]的结论,相关的非局部HJB方程将和代数方程相结合。借助涉及值函数的一般的完全耦合的正倒向随机微分方程解的存在唯一性,证明了相关的和代数方程相结合的非局部HJB方程粘性解的存在性。本章来自于:Hao, T., Zhao, N., General fully coupled FBSDEs involving the value function and related nonlocal Hamilton-Jacobi-Bellman equations combined with algebraic equations,已投稿Chinese Annals of Mathematics Series B二审。第六章中将Buckdahn, Li, Peng和Rainer[21]的工作(仅仅由布朗运动驱动)推广到由布朗运动和泊松随机测度驱动的平均场随机微分方程,并给出相关偏微分方程的概率解释。为了完成这一推广工作,我们证明了若干新的结果,特别是一类新的Ito公式。这一公式的证明并不是Buekdahn, Li, Peng和R ainer[21]工作中给出的Ito公式的平凡推广。事实上,证明这种新的Ito公式的关键在于f(PXst,ξ)关于s导数的研究(参考定理6.6.1)。在没有跳时,这个导数是通过让E[|η|3]→0,f(Pζ0+η)在ξ0∈L2(P)处的二阶Taylor类型的展开式直接得到的。这种方法无法处理带跳的情况:事实上,在没有带跳的情况下,当0<h→0时E[|Xs+ht,ζ-Xst,ζ|3]=O(h3/2);然而在带跳的情况下,仅仅可以得到E[|Xs+ht,ζ-Xst,ζ|3]=O(h)。为了克服这一由于跳项产生的困难,不得不考虑由泊松随机测度和由潜在的布朗运动的所有信息构成的信息流。这一技术和一系列估计,使得在标准假设f∈Cb2,1(P2(Rd))下,可以计算其导数(参见定理6.6.1)。借助这一结果证明了定理6.6.2中的Ito公式。从而根据这一新的Ito公式证明了,值函数V(t,x,Pζ):=E[Φ(XTt,x,Pζ,PXTt,ζ)],其中Φ:R×P2(Rd)→R是一个足够光滑的函数,是相关偏微分方程的唯一经典解。本章的主要创新点:1.使用一种新的方法得到了适合处理带跳项的一般的Ito公式;2.给出了相关的非局部积分-偏微分方程的概率解释。本章基于:Hao, T., Li, J., Mean-field SDEs with jumps and nonlocal integral-PDEs, Nonlinear Differential Equations and Applications. 23(2) (2016), pp. 1-51.以下是本文的章节目录及主要结论。一、第一章引言;二、第二章和值函数耦合的倒向随机微分方程和相关的最优控制问题;三、第三章和上、下值函数耦合的倒向随机微分方程及相关的微分对策问题;四、第四章涉及值函数的完全耦合的正倒向随机微分方程及相关的HJB方程的粘性解;五、第五章涉及值函数的一般的完全耦合的正倒向随机微分方程和与代数方程相结合的非局部HJB方程;六、第六章带跳的平均场随机微分方程和非局部积分-偏微分方程。第二章:提出了一类新的倒向随机微分方程,称为和值函数耦合的倒向随机微分方程;证明了这类方程存在唯一解;通过该方程的解定义的值函数是确定性的,并且是相关的非局部偏微分方程的唯一粘性解。考虑下面和值函数耦合的倒向随机微分方程:固定零时刻初始值和控制(x0,v)∈Rn×V0,T,对于给定的(t,x)∈[0,T]×Rn,用一种迭代方法证明了上述方程有唯一解(Yt,x,v,Zt,x,z,W(t,x))。定理2.2.2在假设(H2.2.1)和(H2.2.2)之下,上述和值函数耦合的倒向随机微分方程有唯一解(Yt,x;v,Zt,x;v,W),(t,x,v)∈[0,T]×Rn×Vt,T并且(Yt,x;v,Zt,x;v)∈ SF2(t, T; R)×HF2(t,T;Rd)和W(t,x)=esssup Ytt,x;v, v∈Vt,T (t,x)∈[0,T]×Rn,蓠足(ⅰ)对于所有的(t,x)∈[0,T]×Rn,W(t,x)是Ft-可测的;(ⅱ)对于所有的(t,x), (t,x)∈ [0,T]×Rn,(ⅲ)对于某个常数C>0,|W(t,x)|≤C(1+|x|),P-a.s.,(t,x)∈[0,T]×Rn借助于延拓的倒向半群概念,证明了上述值函数W(t,x)满足动态规划原理:定理2.3.1(动态规划原理)在假设(H2.2.1)和(H2.2.2)之下,对于所有的(t,x)∈[0,T]×Rn,0≤t≤T-δ, P-a.s有使用一种的新的,不同于Peng给出的倒向半群方法,证明了该值函数W(t,x)是下面非局部偏微分方程的唯一粘性解:定理2.4.1(存在性)在假设(H2.2.1)和(H2.2.2)之下,定理2.2.2中由和值函数耦合的倒向随机微分方程的解所定义的值函数W∈Cp([0,T]×Rn)是上述偏微分方程的一个粘性解。定理2.4.2(唯一性)上述值函数W在函数类Θ中是上述偏微分方程的唯一粘性解。第三章:考虑了平均场框架下,解耦的正倒向随机微分方程控制系统的随机微分对策问题;提出了一类和上、下值函数耦合的倒向随机微分方程,通过这个方程的解定义的上、下值函数是确定性的、满足动态规划原理;相关的两个HJB-Isaacs方程是耦合的;这两个值函数构成的二元组是这个耦合的HJB-Isaacs方程系统的唯一粘性解。固定(x0;v,v)∈Rn×u0,T×V0,T,考虑和上、下值函数耦合的受控的倒向随机微分方程:使用上一章中介绍的迭代方法,证明了上述方程存在唯一适应解(Yt,x,u,v,Zt,x,u,v, W(t,x),U(t,x))。定理3.1.2在假设(H3.1.1)和(H3.1.2)下,上述倒向随机微分方程有唯一适应解(Yt,x;u,v,Zt,x;u,v,W,U)。进一步,W和U满足:存在一个仅仅依赖于L的常数C>0使得,对于所有的x,x∈Rn,t∈[0,T],P-a.s.,(H3.1.3)对于所有的(s,x’,x,y,z,u,v)∈[0,T]×Rn×Rn×R×Rd×U×V,函数f(s, x’, y’, y", x, y, z, u, v)关于y’和y”是非减的。定理3.1.3(比较定理)令fi= fi(t,x’,y’,y",x,y,z,u,v)和φi,i=1,2,满足(H3.1.2),(H3.1.3)。令(Yi,t,x;u,v, Zi,t,x;u,v, Wi, Ui)是带有系数(fi,φi)的倒向随机微分方程的解。则,如果f1≥f2和φ1≥φ2,P-a.s.,有Ys1,t,x;u,v≥Ys2,t,x;u,v,P-a.s.,s∈[t,T], (t,x)∈ [0,T]×Rn, u∈Ut,T,v∈Vt,T。进一步,W1(t,x)≥ W2(t,x), U1(t,x)≥ U2(t,x), P-a.s., (t,x)∈ [0,T]×Rn。相关的两个HJB-Isaacs方程是耦合的,且二元组(W,U)是这个耦合的HJB-Isaacs方程系统的唯一粘性解。对于(t,x)∈[0,T]×Rn,考虑下面耦合的非局部HJB-Isaacs方程定理3.2.1(存在性)在假设(H3.1.1)和(H3.1.2)之下,定理3.1.2中的(W,U)∈Cp([0,T]×Rn;R2)是上述方程的一个粘性解。定理3.2.2(唯一性)定理3.1.2中的(W,U)在空间Θ×Θ中是上述方程的唯一粘性解。第四章:使用一种新的迭代方法,证明了涉及值函数的完全耦合的正倒向随机微分方程的解存在唯一;通过该方程的解定义的值函数满足动态规划原理和正则性条件,且是相关非局部偏微分方程的粘性解;当系数σ不依赖于(y,z)时,该值函数是唯一粘性解。考虑涉及值函数的完全耦合的正倒向随机微分方程:定理4.2.1假设(H4.2.1),(H4.2.2Lo),(H4.2.3)成立。则,上述涉及值函数的完全耦合的正倒向随机微分方程有唯一解{(Xst,x;v,Yst,x;v,Zst,x;v)s∈[t,T]∈SF2(t,T;Rn)×SF2(t,T;R)× HF2(t,T;R),(t.x)∈[0,T]×Rn,W∈W}。定理4.2.2(动态规划原理)假设(H4.2.1),(H4.2.2Lo)和(H4.2.3)成立,则存在一个依赖于L的正常数δ0,使得,对于0≤t≤T-δ,其中δ满足0<δ≤δ0.考虑相关的偏微分方程定理4.3.1假设(H4.2.1),(H4.2.2Lo)和(H4.2.3)成立。则由定理4.2.1给出的值函数W(t,x)∈C([0,T]×Rn)是上述HJB方程的一个粘性解。定理4.3.2当σ不依赖于y时,在假设(H4.2.1),(H4.2.2Lo)和(H4.2.3)之下,值函数W(t.x)在函数类Θ中是上述HJB方程的唯一粘性解。第五章:研究了一类一般的完全耦合的正倒向随机微分方程,称为涉及值函数的一般的完全耦合的正倒向随机微分方程,即正倒向方程的系数b,σ,f依赖于(x,y,Z)和v;应用迭代方法,证明了这类方程的解存在唯一;当所有的系数是确定性函数时,通过该方程的解定义的值函数是确定的,满足正则性条件,且是相关的与代数方程相结合的非局部偏微分方程的粘性解。考虑涉及值函数的一般的完全耦合的正倒向随机微分方程:定理5.1.1在假设(H5.1.1)-(H5.1.4)和(H5.1.5)’,(H5.1.6)之下,上述涉及值函数的一般的完全耦合的正倒向随机微分方程有唯一解{(Xt,x;v,Yt,x;v,Zt,x;v)∈SF2(t, T;Rn) ×SF2(t,T;R)×HF2(t,T;Rd), W∈WL0}。考虑下面与代数方程相结合的非局部HJB方程:定理5.3.1假设(H5.1.1)-(H5.1.4)和(H5.1.5)’,(H5.1.6)成立,定理5.1.1中定义的值函数W是上述方程的一个粘性解。定理5.3.2假设σ不依赖于(y,z),假设(H5.1.1)-(H5.1.4)和(H5.1.5)’,(H5.1.6)成立,定理5.1.1中定义的值函数W(t,x)在函数类Θ中是上述方程的唯一粘性解。第六章:研究带跳的平均场随机微分方程;证明了这类带跳的平均场随机微分方程的解存在唯一;两元组(Xt,ζ, Xt,x,Pζ )满足流性质;得到了适合处理带跳项的Ito公式;借助这一公式,证明了涉及分布的值函数V(t,x,Pζ) =E[Φ(XTt,x,Pζ,PXTt,ζ)]是相关偏微分方程的唯一经典解。考虑两个随机微分方程:定理6.2.1在假设(H6.2.1)之下,上述两个方程有唯一解Xt,ζ= (Xst,ζ)s∈[t,T]和Xt,ζ= (Xst,ζ)s∈[t,T]∈SF2(t,T;Rd),且解Xt,x,ζ独立于Ft。定理6.3.1在假设(H6.3.1)之下,Xt,x,Pξ的L2-导数(?)xXt,x,Pζ= ((?)Xt,x,Pζ,j)1≤j≤d存在。定理6.3.3假设定理6.3.2中的假设成立。则,对于0≤t≤T,x∈Rd,映射Xt,X, : L2(Ft;Rd)→ L2(Fs;Rd)是Frechet可微的,且它的Frechet导数就是Gateaux导数,即这里对于注6.3.2由定理6.3.3可知,Xt,x,ζ关于ξ是Frechet可微的。按照函数f:P2(Rd)R导数定义的延拓,可以考虑Xt,x,Pζ关于分布Pξ的可微性,而且这个导数就是Nt,x,Pζ(y),即,(?)μ Xt,x,Pζ(y)=Nst,x,Pζ(y), s∈[t,T], y∈Rd,0 ≤t≤T, x∈Rd,ζ∈L2(Ft;Rd)。定理6.6.1假设f∈Cb2,1(P2(Rd))。则,在假设(H6.4.1)之下,对于所有的0≤t≤s≤ T,ζ∈L2(Ft;Rd),有定理6.6.2令ψ∈Cb1,(2,1)([0,T]×Rd×P2(Rd))。在假设(H6.4.2)之下,有如下的Ito公式:对于0≤t≤s≤T,x∈Rd,ζ∈L2(Ft;Rd),考虑非局部积分-偏微分方程:定理6.6.3令Φ∈Cb2,1(Rd×P2(Rd))和(H6.4.1)成立。则函数V(t,x,Pζ):=E[Φ(XTt,x,Pζ, PX(?)t,ζ)],(t,x,ζ)∈[0,T]×Rd×L2(Ft;Rd)在Cb1,(2,1)([0,T]×Rd×P2(Rd))中是上述偏微分方程的唯一经典解。
其他文献
如何帮助医学生,尤其是护理专业医学生提高学习人体解剖学的积极性,培养她们的主动学习和动手能力。我们在解剖学实验教学中改变传统的教学模式,采取以讨论&#183;临床病案的方式
近年来,随着我国高等职业教育蓬勃发展,毕业生就业难的问题日益凸显,对高职毕业生而言,解决就业难的最根本途径在于提升毕业生的就业竞争力。文中分析了高职毕业生就业竞争力的组
以新鲜浒苔、小黄花鱼为主要原料,研究了原料预处理、调味炒制等工艺条件对浒苔鱼松产品的影响。通过正交设计和感官评定,确定小黄花鱼调味料最佳配方为:食盐3.0%,味精0.8%,白
  随着经济的全球化,社会生产力的大发展导致了生产能力以及商品的极大丰富并出现相对过剩,企业之间的市场竞争也开始集中为对顾客的争夺。在中国,汽车销售行业作为新世纪以来
目的 提出一种科学合理、用于评价产前检查利用水平的指数。方法 结合世界卫生组织最新的临床指南及有关医学证据,对adequacy of prenatal care utilization(APNCU)指数的算法
目的利用2015年四川省病案首页280717例呼吸系统疾病病例,基于不同粗分组方法建立并评价DRGs模型。方法以临床诊断结合统计分析分组(粗分组一)、单纯临床诊断分组(粗分组二)
<正>Severe acute respiratory syndrome coronavirus(SARS-CoV)is the etiological agent of SARS emerged in province Guangdong,China during 2002 and 2003.The epidemi
会议
衔接是系统功能语言学研究的一个重要方面,国内外学者从不同的角度进行了广泛而深入的研究。与英语语言重型合不同,汉语重意合,这使得汉语语篇衔接的研究更侧重于语义的研究。本
中图分类号:G623.31 文献标识码:A 文章编号:1008-925X(2011)09-0142-01  语言是文化的重要载体,文化是语言所承载的内容,两者关系十分密切。语言离不开文化,文化依靠语言,英语教学是语言教学,当然离不开文化教育。现代外语教学强调培养学生的交际能力。语言能力是交际能力的基础,但是具备语言能力并不意味着具备了交际能力,随着对交际理论的研究及其在中学英语教学中的应用,很多的
针对独立学院工程力学教学现状,阐述了软件辅助在力学课程教学中的作用。将MDSolids力学问题求解器引入教学中,可提高教学效率,增加学生的学习兴趣,提高学生的应用能力。最后,给出