Wasserstein空间中关于测度的偏导数及其在受控的平均场系统中的应用

来源 :山东大学 | 被引量 : 1次 | 上传用户:michaelgang1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
平均场随机微分方程,也称为Mckean-Vlasov方程,在统计力学、物理学、量子力学和量子化学等领域都有着广泛的应用。2007年,J.M.Lasry,P.L.Lions[62]首次给出了此类方程在经济、金融以及随机微分对策中的应用。Buckdahn,Djehiche,Li,Peng[16]完全借助于随机方法研究了一类特殊的平均场问题,推导得出一种新型的倒向随机微分方程,称为平均场倒向随机微分方程。自此,越来越多的学者开始研究这类McKean-Vlasov型方程,相关的最优控制问题也受到广泛关注。2013年,法国科学院院士 P.L.Lions[73]首次引入了函数关于测度的可微性的定义,这将平均场问题的研究提升到了一个新的高度。受此启发,Buckdahn,Li,Ma[19]研究了一类推广的平均场随机控制系统,其系数不仅依赖于状态过程,还依赖于状态过程的分布,他们借助于Peng[84]提出的变分方程的二阶泰勒展开方法给出了全局随机最大值原理。在受控系统中,“参与者”需要基于自己已掌握的信息进行决策。但是现实中会经常出现不完全信息的情况,“参与者”无法观测到所有的信息或者并不是所有信息都是有效的,只能通过掌握的部分信息来进行决策。因此,研究基于部分观测的随机控制问题具有重要的现实意义。本论文主要研究了两方面的内容:一、在对第二边际分布μ2=μ(Rd ×·)没有正则性假设的情况下,研究函数以第二边际分布μ2为条件,关于分布μ的偏可微性质;二、研究Wasserstein空间中关于测度的偏导数在随机控制问题中的应用:带部分观测的平均场受控系统下的最大值原理。下面将详细的介绍论文的内容及结构。第一章主要介绍了论文第二章和第三章中所研究的问题以及研究背景。第二章主要研究了 Wasserstein空间中关于测度的偏导数。设(E,ε)为任意一个可测空间,研究函数f:P2,0(Rd × E)→R的偏导数,其中,P2,0(Rd × E)是定义在(Rd × E,B(Rd)(?)ε)上的概率测度μ的集合并且满足其第一边际分布μ1:=μ(·×E)具有有限二阶矩。概率测度μ关于其第二边际分布μ2(·)=μ(Rd ×·)具有如下分解:μ(dxdz)=q(dx,z)μ2(dz)。本章所研究的是f关于q(dx,z)的偏导数,简单来讲,我们研究的是以第二边际分布为条件的关于测度μ的偏导数。本章的主要创新点:P.L.Lions[73]中给出了函数g:P2(Rd)→R关于测度的导数,这里的P2(Rd)是定义在Rd上具有有限二阶矩的概率测度全体。我们注意到,由于空间(E,ε)仅满足可测性条件,在这种情况下函数f:P2,0(Rd × E)→ R关于测度μ是不具备全局可微性的,本章的研究内容推广了[73]中的结果。第三章探讨了 Wasserstein空间中关于测度的偏导数在随机控制问题中的应用,受控状态过程由带部分信息的一般平均场随机微分方程驱动。控制集仅仅是一个可测集,受控系统的系数(即动力系统的系数和代价泛函的系数)依赖于受控状态过程X,控制v,关于X的部分信息以及(X,v)的联合分布,我们研究了这个控制系统下最优控制的必要条件,即随机最大值原理。变分方程的二阶展开是证明随机最大值原理的关键,但是由于系数b和σ不仅依赖于E[Xt1]FtW1],而且还依赖于联合分布P(x,v),所以在证明二阶展开时有一些技术上的困难,这里采用了新方法证明了相关估计。本章的主要创新点:将控制集推广到一般的可测集情形,并且控制系统是一个推广的受控平均场随机微分方程且依赖于部分信息。处理部分信息以及分布项的估计都采用了技术性较强的方法,其中,对于反映平均场受控系统特性的估计,我们提出了一个算子方法来进行证明,这是一个与经典情形不同的全新方法。上述两章来自于论文:R.Buckdahn,Y.Chen,J.Li.Partial derivative with respect to the measure and its application to controlled mean-field systems with partial information.已投稿.本文由上述三个章节组成,以下是本文的章节结构和主要结论。一、第一章引言;二、第二章Wasserstein空间中关于测度的偏导数;三、第三章带部分观测的平均场受控系统的随机最大值原理。第二章:我们主要研究了在对第二边际分布μ2=μ(Rd×·)没有正则性假设的条件下,函数以第二边际分布μ2为条件,关于分布μ的偏可微性质。设(E,ε)为任意一可测空间。我们记P(Rd × E)为定义在(Rd ×E,B(Rd)(?)ε)上所有概率测度的集合,同时我们记P2,0(Rd × E):={μ∈P(Rd × E):∫Rd×E|x|2μ((dxdz)<+∞}.对概率测度μ∈P2,0(Rd ×E),我们记μ的边缘分布为μ1(A):=μ(A × E),A∈B(Rd),μ2(B):=μ(Rd × B),B∈ ε,给定函数f:P2,0(Rd × E)→ R,以及任意μ ∈P2,0(Rd × E),我们想要研究f在μ处关于q(dx,:)的偏可微性质,其中μ(dxdz)=q(dx,z)μ2(dz)。我们将q记作qμ。记(?)(ξ,v):=f(P(ξ,v)),(ξ,v)∈L2(F;Rd)× L0(F;E),为f在 L2(F;Rd)× L0(F;E)上的提升函数。在Frechet,导数的意义下,我们如下定义函数f的偏可微性。定义0.1 称f:P2,0(Rd × E)→ R在μ∈P2,0(Rd × E)处关于qμ是偏可微的,如果存在某个随机变量(ξ,v)∈L2(F;Rd)× L0(F;E),且其联合分布为P(ξ,v)=μ,使得ξ’→fv((ξ’):=f((ξ’,v)作为定义在Hilbert空间L2(F;Rd)上的函数在ξ处是Frechet可导的。记Frechet导数为(?)∈ L((L2(F;Rd);R),根据Riesz表示定理可以得到,存在随机变量(?)∈ L2(F;Rd),有f(P(ξ+η,v)-f(P(ξ,v)=(?)+o(|η|L2)=(?)+o(|η|L2)对于任意η∈ L2(F;Rd)且 |η|L2:=(E[|2])1/2→ 0。为了证明关于分布的偏可微性质,我们需要讨论以下技术性结论。引理0.2(Ω,F)是一个Radon空间,即,这个空间中的任意Borel概率测度是内正则的。Radon空间有如下的等价性质:(Ω,F)满足正则条件概率性质,i.e.,对任意(Ω,F)上的概率测度P,任意可测空间(E,ε)及任意可测映射v:Ω→E,存在正则条件概率测度P|v=.:E ×F→[0,1],使得ⅰ)P|v=z(·)是F上的概率测度,对任意z∈E;ⅱ)P|v=(A):E→[0,1]是ε-可测的,对任意A ∈ F;ⅲ)P{A|v=z}=P|v=z(A),Pv(dz)-a.s.,对任意z ∈E及A ∈F。设ξ,θ∈L2(F;Rd),v是一个定义在(Ω,F,P)上取值于可测空间(E,ε)的可测映射。设γ∈L2(F,Rd)为一独立于(ξ,θ,v)的标准Gaussian向量。对任意ε>0,我们取θε:=θ+εγ。命题0.3 引用上述记号,对任意ε>0,存在一个可测映射Hε:Rd × E→Rd使得,Pv(dz)-a.s.对于 z∈E,ⅰ)PHε(θε,v)=z=Pξ|vz,ⅱ)E[|ξ-θε|2|v=z]≥E[|Hε(θε,v)-θε|2|v=z].现在我们将P.L.Lions给出的关于概率测度可微性的基础结果做出以下推广:根据引理0.2以及命题0.3,我们可以将关于测度的偏导数刻画为一个Borel函数,且这个函数仅通过分布F(ξ,v)内依赖于(ξ,v)。定理0.4在以上假设和记号下,存在μ(dydz)-a.s.唯一可测函数g:Rd× E →Rd使得Dfv(ξ)=g(ξ,v),P-a.s.另外,函数g=(y,z)依赖于(ξ,v)仅仅通过它的分布μ=P(ξ,v)。由上面的定理,我们可以定义:((?)μf)1(μ,y,z):=g(y,z),(y,z)∈Rd × E,并称其为函数f:P2,0(Rd ×E)→ R在μ处关于q(dy,z)的偏导数。此外,我们注意到这个函数是μ(dydz)-a.s.唯一定义在Rd × E中的。第三章:研究了平均场框架下,带部分信息的受控系统的最优控制问题。本章中的控制集仅仅是一个可测集,受控系统的系数(即动力系统的系数和代价泛函的系数)依赖于受控状态过程X,控制v,关于X的部分信息以及(X,v)的联合分布,我们研究了这个控制系统下最优控制的必要条件,即全局随机最大值原理。我们考虑有如下状态方程的最优控制问题(?)t∈[0,T],最优控制问题的目标是在可容许控制集uad上最小化如下代价泛函:J(v):=E[∫0T(t,P(xt,v,vt),Xtv,E[Xtv|FtW1],vt+φ(PXTv,XTv,E[XTv|FTW1])],称u ∈ uad为最优控制,如果满足#12为了得到随机最大值原理,我们需要引入如下一阶和二阶伴随方程:#12#12其中H(t,μ,x,y,v,p,q):=pb(t,μ,x,y,v)+qσ(t,μ,x,y,v)-f(t,μ,x,y,v).现在我们介绍一阶和二阶变分方程:(?)t∈[0,T],#12定义最优控制u的针状变分如下:Uε(t):=v(t)IEε(tl)+u(t)IEεc(t),t∈[0,T],记X:=Xu和Xε:=Xuε分别是关于u和uε的受控状态过程。下面的命题验证了变分方程的正确性。命题0.5假设(H3.2.1)成立,对任意p>1,存在一个依赖于p的常数Cp>0,使得,对任意ε ∈(0,1],#12#12下面两个技巧性的估计对得到Xε的二阶展开式起到了重要作用。命题0.6设θ ∈ LF2(0,T)且满足Eθt2]≤Cθ,t∈[0,T]。则有:存在一个函数ρ:[0,T]× R+→ R+满足:当 ε→ 0 时,ρt(ε)→ 0,并且ρt(ε)≤ Cθ’,t ∈[0,T],ε>0,且有| E[θtXt1]|≤ρt(ε)(?),ε>0,t∈[0,T],其中cθ,Cθ’为仅通过E[θt2]∈[0,T]的界限依赖于θ的常数。引理0.7假设(H3.2.1),(H3.2.2)以及(H3.2.3)成立。那么,对于任意的p ≥ 2,存在某个函数ρt(p):R+→ R+满足:当ε → 0时,ρt(p)(ε)→ 0,并且ρt(p)(ε)≤Cp,t∈[0,T],ε>0,对某个Cp ∈ R+成立,且有E[|E[Xt1|FtW1]|p]<ε2/p(ε),t ∈[0,T],ε>0.下面的命题给出了关于Xε的二阶展开式,也是证明最大值原理的关键所在。命题0.8假设(H3.2.1),(H3.2.2)以及(H3.2.3)成立。那么,对于任意的1 ≤ p≤2/3,我们有#12其中ρ(·)是定义在(0,∝)上的正值函数,使得ρ(ε)→0,当ε→0时。现在,我们给出如下随机最大值原理。定理0.9假设(H3.2.1),(H3.2.2)以及(H3.2.3)成立,并且设(u,X)为控制问题(3.2.1)-(3.2.3)的最优解。则有:对任意的v∈uad,a.e.t∈[0,T],P-a.s.H(t,P(Xt,vt),Xt,E[Xt |FtW1],vt,pt,qt)-H(t,P(Xt,ut),Xt,E[Xt|FtW1],ut,pt,qt)+1/2Pt|σ(t,P(Xt,vt),Xt,E[Xt|FtW1],vt)-σ(t,P(Xt,ut),Xf,E[Xt|FtW1],ut|2≤0.其中,F-适应过程(p,q)和(P,Q),分别为一阶、二阶伴随方程的解。此外,考虑标准维纳空间(Ω=ρC([0,T];R2),F=B(Ω)∨NP,P),W=(W1,W2)为坐标过程,如果对于任意的(t,ω,x,y,v),系数b(t,μ,x,y,v),σ(7(t,μ,x,y,v)和f(t,μ,x,y,v)在W,TV(·,·)-度量下关于μ∈ P2,0(Rd × E)是模连续的,其中连续模ρ:R+→R+是个递增连续函数,满足ρ(0)=0,则有:对任意v∈ Uad以及(?)∈ U,dtdP-a.e.,H(t,P(xt,vt),Xt,E[Xt|FtW1],(?),pt,qt)-H(t,P(Xt,ut),Xt,E[Xt|FtW1],ut,pt,qt)+1/2Pt|σ(t,P(Xt,vt),Xt,E[Xt|FtW1],(?))-σ(t,P(X,tXt,E[Xt|FtW1],ut)|2≤0.
其他文献
研究背景异基因造血干细胞移植(allogeneic hematopoietic stem cell transplantation,allo-HSCT)是根治许多血液系统恶性及非恶性疾病、免疫缺陷病、某些遗传代谢性疾病和严重自身免疫性疾病的主要治疗手段之一。脐带血因其独特的优势,如来源丰富、采集方便、能长期冻存、不易受肝炎病毒、巨细胞病毒和EB病毒等感染、HLA配型要求低、查询方便快捷等优点,且免
自发性孤立性肠系膜上动脉夹层(Spontaneous Isolated Superior Mesenteric Artery Dissection,SISMAD)临床少见,是指自发形成的并且只累及肠系膜上动脉主干及其分支的夹层,多以急性腹痛就诊,如果不能及时做出正确诊断,将有可能导致肠管大面积缺血坏死,严重者甚至死亡,但其临床症状和生化检查缺乏特异性,极易漏诊甚至误诊。临床上迫切需要一种简便、准确
金属的熔体状态是绝大多数金属材料/金属制品制备的必经状态。金属材料的微观结构和物理化学性质通常与其熔体的成分和结构密切相关。因此,研究熔体结构对于设计和制备新型结构和功能材料具有重要的意义。本文建立了一种描述热力学稳定态的金属熔体团族结构模型-Wulff团簇模型,该模型首次应用于描述金属熔体的结构特征,并实现了对形核之前团簇结构及尺寸的变化的研宄,为在原子层次上揭示形核机理提供了理论基础。具体的内
等离子弧焊接具有弧柱挺度大、能量密度集中、熔池内形成穿孔等特点,在中厚板连接方面有很大的应用潜力。但是,常规的等离子弧焊接仍存在穿孔能力不够、小孔稳定性差等问题。针对以上问题,将超声振动通过等离子弧焊枪的钨极施加到等离子弧和熔池中,研发了超声辅助穿孔等离子弧焊接新工艺(Ultrasound assisted Keyholing Plasma Arc Welding,U-PAW)。前期工艺实验已经证
随着微机电系统和微系统技术的快速发展,对微成形用薄板材料提出更高的性能要求。微成形用坯料应具备良好的塑性及有利于提高微型件力学性能、质量和精度的微观结构,而现有薄板因轧制加工存在严重的加工硬化及各向异性,晶粒间协调变形能力差,影响微型件的力学性能及成形质量。因此,金属薄板的性能改善和微观组织调控成为微成形工艺发展的关键基础问题之一。大塑性变形工艺和脉冲电流处理工艺分别在材料细化晶粒和提高综合力学性
低维材料具有优异的电学、磁学、热学和力学性能,在未来的电子器件、柔性材料、新型功能器件和纳机电系统等领域具有重大的应用前景。力学性能是评价低维材料使用寿命的一项关键指标,良好的塑性、强度和电子性能才能保证低维材料在柔性器件中的实际应用,因此,研究低维材料力电性能有着重要意义。众多研究工作集中到低维材料的实验制备,通过合理控制实验参数,制备出性能优异、功能强大的低维材料。然而,实验工作难以从分子或原
随着高性能机床和超硬刀具材料的不断发展,具有明显技术优势和经济优势的硬态切削技术越来越多地被应用于金属加工领域,比如铸铁和淬硬钢的硬态铣削和车削。由于硬态切削过程中不使用切削液或仅使用微量可降解切削油,刀具—切屑(简称刀—屑)和刀具—工件(简称刀—工)接触区的强机械—热载荷耦合作用往往会引起切屑和切削亚表层材料的显微组织发生演变,诸如相变、动态再结晶、晶体取向等多种金相状态的改变,从而引起切屑和切
随机控制是现代控制理论中非常重要的一个组成部分。在我们所研究的随机控制问题中,我们的目标是随时通过观察到的信息,来选择合适的控制,使得随机动力系统中的某个指标的泛函达到一个最优的情形。例如,在股票市场中,通过随时更新自己的投资组合使得在某个时刻的财富值达到最大,这就可以看作是一个随机控制问题。解决随机控制问题有两个著名的经典方法,分别是随机最大值原理(SMP)和动态规划原理(DPP)。前者得到了最
天然产物具有多种生物活性,如抗细菌,抗病毒,抗肿瘤等作用,一直是药物研发的重要来源。同时,天然产物中的色素类化合物因易于降解和环境友好等特点,可以作为生物染料替代化学染料使用。近年来由于抗生素的大量使用,导致多种临床耐药菌的产生。由于新抗菌药物的严重缺乏,使得人类对新药的需求迫在眉睫,而依赖于传统手段的天然产物发掘遇到瓶颈,发现新化合物的几率越来越小。链霉菌是一种革兰氏阳性菌,可以产生多种具有应用
生物冶金工艺由于其具有成本低、操作简便、回收率高和环境友好等优点,而被广泛应用于低品位、难处理矿石的开采。由于生物冶金过程是一个重金属离子不断溶出和积累的过程,尤其在生物冶金的中后期,浸矿体系中高浓度的有毒重金属离子成为制约生物冶金效率的重要因素。铜矿作为采用生物冶金技术开采最多的矿产资源,其浸出效率难免受到浸出体系中高浓度铜离子的影响,因此,构建稳定遗传的高抗铜基因工程菌将是解决上述问题的有效途