在没有Isaacs条件下的随机微分对策问题

来源 :山东大学 | 被引量 : 0次 | 上传用户:cutuf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微分对策问题实际上可以看作是一种双(多)方的控制问题,而通常的控制问题可以看作是单人微分对策问题。Isaacs [53]在1954年首次利用微分方程来研究对策问题,即微分对策。自此以后,很多专家学者开始研究微分对策问题及其在经济、社会科学等方面的应用。Fleming, Souganidis [46] 1989年研究了二人零和随机微分对策,证明了在Isaacs条件下,随机微分对策的上值函数和下值函数是相等的,称为该对策问题有值函数。他们的工作把Evans, Souganidis [40]的工作首次推广到了随机情形。随着倒向随机微分方程理论的不断发展和成熟,有很多学者利用此理论来研究对策问题。Hamadene, Lepeltier [49]利用倒向随机微分方程的解,构造了零和随机微分对策的鞍点。Hamadene, Lepeltier, Peng [51]研究了非零和随机微分对策,通过相关的倒向随机微分方程的解,构造了对策的Nash均衡点。Buckdahn, Cardaliaguet, Rainer[9]研究了非零和随机微分对策的Nash均衡问题,证明了等价的Nash均衡支付的存在性。Cardaliaguet [26]首次研究了带不对称信息的零和微分对策,证明了值函数的存在性。对于在没有Isaacs条件下的零和随机微分对策,其值函数的存在性问题是一个公开问题。Krasovskii, Subbotin [60]首次考虑了在没有Isaacs条件下的零和确定性微分对策,他们利用位置策略得到值函数的存在性。Buckdahn, Li, Quincampoix [22][23]在没有Isaacs条件下,利用带延迟的非预期混合策略,分别研究了零和微分对策与零和随机微分对策,均得到了值函数的存在性。本论文基于以上工作,进一步研究了在没有Isaacs条件下的二人零和微分对策与零和随机微分对策、非零和微分对策与非零和随机微分对策。最后,我们考虑了一类新型的反射平均场倒向随机微分方程,即与值函数耦合的受控的反射平均场倒向随机微分方程。更详细地,本论文的内容和结构如下。在第一章中,我们给出了第二章到第五章的引言。在第二章中,我们主要考虑了在没有Isaacs条件下的二人零和微分对策,其中代价泛函为带不对称信息的终端泛函。为克服Isaacs条件的缺失及保护各自的私人信息,两个竞争者均考虑了带延迟的非预期随机策略。我们的策略与Buckdahn, Quincampoix, Rainer和Xu[25]中的策略不同。首先,我们的策略依赖于对策开始之前的信息,且双方均可相互观察;其次,我们定义在时间区间[t,T](0≤t≤T)上的带延迟的非预期随机策略保证了伴随[0,T]的划分π的一个随机策略关于一个更细的划分π’(π(?)π’)仍然是一个带延迟的非预期随机策略,基于此性质,我们研究了当两个竞争者采取不同划分时的上值函数和下值函数的极限行为。另一方面,我们研究了在同一个划分下的上值函数和下值函数的性质、相关的次-动态规划原理,利用Fenchel变换,考虑了与相关的Hamilton-Jacobi-Isaacs方程的联系,证明了值函数的存在性。本章的主要创新点:推广了Buckdahn, Quincampoix, Rainer和Xu[25]中带延迟的非预期随机策略的定义,在没有Isaacs条件下证明了带不对称信息的微分对策的值函数是存在的。进一步,为方便值函数的数值计算,我们给出了值函数的刻画。第三章:在第二章的框架下,我们进一步研究了带对称信息的二人非零和微分对策的Nash均衡支付的存在性。我们的结论把Buckdahn, Cardaliaguet和Rainer9]的工作推广到了不用假设Isaacs条件的情形。本章的主要创新点:首次考虑了在没有Isaacs条件下的非零和微分对策,给出了Nash均衡支付的等价定义。我们研究了Nash均衡支付的刻画性质,利用此性质证明了Nash均衡支付的存在性。上述两章来自于论文:J. Li, W. Li. Zero-sum and nonzero-sum differential games without Isaacs condition.已投稿。文章网址:http://arxiv.org/abs/1507.04989。在第四章中,我们主要研究了在没有Isaacs条件下的二人非零和随机微分对策的Nash均衡问题,把第三章关于微分对策的工作推广到了随机微分对策的情形。伴随[0,T]的划分π,我们选择一适当的带延迟的非预期随机策略来研究非零和随机微分对策的Nash均衡问题。我们首先证明了在没有Isaacs条件下的零和随机微分对策的值函数是存在的,进而给出了非零和随机微分对策的Nash均衡支付的刻画,利用此刻画证明了Nash均衡支付的存在性。本章的主要创新点:首次考虑了在没有Isaacs条件下的非零和随机微分对策,给出了一新的Nash均衡支付的定义。我们研究了Nash均衡支付的刻画性质,利用此性质证明了Nash均衡支付的存在性。本章来自于论文:J. Li, W. Li. Nash equilibrium payoffs for nonzero-sum stochastic differential games without Isaacs condition已投稿。在第五章中,我们考虑了一类新型的反射平均场倒向随机微分方程,即与值函数耦合的受控的反射平均场倒向随机微分方程。利用逼近的方法,我们不仅证明了此类方程解的存在唯一性,而且给出了相关的比较定理。通过推广Peng在[104]中引入的随机倒向半群的定义,我们得到了相关的动态规划原理。进一步,我们证明了与反射平均场倒向随机微分方程耦合的值函数是相关的带障碍的非局部抛物偏微分方程的唯一粘性解。本章的主要创新点:把Hao和Li[50]的工作推广到了带反射的情形,证明了与值函数耦合的受控的反射平均场倒向随机微分方程解的存在唯一性,并为相关的带障碍的抛物型偏微分方程的粘性解提供了概率解释。本章来自于论文:J. Li. W. Li. Controlled reflected mean-field backward stochastic differential equa-tions coupled with value function and related PDEs. Mathematical Control and Related Fields,5 (3).501-516,2015.下面是本文的章节目录和主要内容。一、第一章引言;二、第二章在没有Isaacs条件下的带不对称信息的零和微分对策;三、第三章在没有Isaacs条件下的非零和微分对策的Nash均衡问题;四、第四章在没有Isaacs条件下的非零和随机微分对策的Nash均衡问题;五、第五章与值函数耦合的受控的反射平均场倒向随机微分方程及相关的PDEs。第二章:一方面,在没有Isaacs条件下,我们证明了当划分π的细度趋于0时,上、下值函数W”和Vπ一致收敛于同一个函数U,即对策的值函数是存在的,且值函数U为相关的Hamilton-Jacobi-Isaacs方程的唯一对偶粘性解;另一方面,我们给出了值函数U的刻画,证明了在Isaacs条件下,上、下值函数W和V是相等的,即成立W=U=V。对于任意给定的t ∈ [0,T], ∈ Rn,考虑如下动态系统:对于(p,g)∈△(I)×△(J),(t,x)∈[0,T]×Rn,π={0=t0<t1<…<tN=T)及t ∈[tk-1,tk),我们定义如下代价泛函下面我们介绍本章中要研究的上值函数:和下值函数:其中为得到值函数的存在性,我们研究了伴随同一划分π的上下值函数Wπ和Vπ。借助Buckdahn,Li[16]中引入的Girsanov变换的方法,我们可通过研究(w1π,V1π)来研究(Wπ,Vπ)。结合Cardaliaguet[26]或Buckdahn,Quincampoix,Rainer,Xu[25]中引入的Fenchel变换的方法,我们证明了(W1π,V1π)一致收敛于同一个函数,从而得到了值函数的存在性。定理2.2.1对任意的(t,x,p,q) ∈[0,T]×Rn×△(I)×△(J),有其中引理2.2.2函数W1π和V1π关于(t,x,p,q)是Lipschitz连续的,关于划分π一致。引理2.2.3对于任意的(t,x) ∈[0,T]×Rn,函数W1π(t,x,p,q)和V1π(t,x,p,q)均关于p ∈△(I)是凸的,关于q∈△(J)是凹的。引理2.2.4对于所有的(t,x,p,q)∈[0,T]×Rn×RI×△(J),V1π*(x,x,p,q)有以下表达式引理2.2.5对于时间区间[0:T]的所有划分π,凸共轭函数V1π*(t,x,p,q)关于其所有变量(t,x,p,q)是Lipschitz的,凹共轭函数W1π#(t,x,p,q)关于其所有变量(t,x,p,q)是Lipschitz的,且Lipschitz常数与划分π的选择无关。引理2.2.6(次-DPP)对于所有的(t,x,p,q) ∈[tk-1,tk)×Rn×RI×△(J)和所有的l(k≤l≤N),如下不等式成立引理2.2.7存在(πn)n>1的一个子序列,仍记为(πn)。>1,及两个函数V:[0,T]× Rn×RI×△(J)→R和W:[0,T]×Rn×△(I)×RJ→R使得(W1πn*,W1πn#)在[0,T]×Rn×△(I)×△(J)×Rn×RJ的紧集上一致收敛于(V,W)。引理2.2.8对所有的(p,q) ∈RI×△(J),极限函数V(t,x,p,q)是HJI方程(2.2.36)的一个粘性下解。引理2.2.9对任意的(t,x,p,q) ∈[0,T]×Rn×△(J)×RJ和所有的l(k≤l≤n),我们有且W(参考引理2.2.7)是HJI方程(2.2.36)的一个粘性上解。定理2.2.2当划分πn的细度趋于0时,函数(V1πn)和(W1πn)在紧集上一致收敛于同一个Lipschitz函数U。此外,函数U是HJI方程(2.2.51)的唯一对偶粘性解。定理2.2.3当划分πn的细度趋于0时,函数(Vπn)和(Wπn)在紧集上一致收敛于同一个Lipschitz函数U。此外,函数U是HJI方程(2.2.51)的唯一对偶粘性解。为研究上、下值函数W和V的性质,我们引入以下辅助函数:再次利用Cardaliaguet[26]或Buckdahn,Quincampoix,Rainer,Xu[25]中引入的Fenchel变换的方法,我们得到了如下主要结论。定理2.3.1若条件(2.3.6)成立,则对于所有的划分π。且|πn|→0,序列(Vπn)和(Wπn)在紧集上一致收敛于HJI方程(2.2.51)的唯一对偶粘性解U。定理2.3.2若条件(2.3.7)成立,则对于所有的划分π。且|π。|→0,序列(Vπn)和(Wπn)在紧集上一致收敛于HJI方程(2.2.51)的唯一对偶粘性解U。定理2.3.3(值函数刻画)在Isaacs条件下,对所有的(t,x,p,g) ∈[0,T]×Rn×△(I)× △(J),成立第三章:本章主要研究了在没有Isaacs条件下的非零和微分对策的Nash均衡支付的存在性问题。我们首先给出Nash均衡支付的刻画,进而证明Nash均衡支付的存在性。在第二章的研究框架下,我们研究了对称信息(I=J=1)下的非零和微分对策。动态系统仍然为第二章中的动态系统,但此时的支付为如下两个泛函:竞争者1的目标是最大化J1(t,x,u,v),而竞争者2的目标是最大化J2(t,x,u,v)。利用Buckdahn,Cardaliaguet,Rainer[9]中的证明方法,结合如下值函数:和在没有Isaacs条件下,我们得到了非零和微分对策的Nash均衡支付(简记为NEP)的存在性。引理3.2.1a)设(t,x) ∈[0,T]×Rn,∈>0。对于任意的划分x={0=t0<t1<…< tN=T}且|π|<δε(δε>0足够小)及t=tk-1,和对于任意给定的存在策略αi ∈A1π(t,T),i=k,…,N,使得对于所有的有b)设(t,x) ∈[0,T]×Rn,ε>0。对于任意的划分丌={0=t0<t1<…<tN=T}且|π|<δε(δε>0足够小)及t=tk-1,和对于任意给定的存在策略αi ∈A1π(t,T),i=k,…,N,使得对于所有的有定理3.2.1(NEP的刻画)(e1,e2)∈R2是(t,x)处的NEP,当且仅当对所有的(?)>0,存在δ(?)>0使得对于任意的划分π={0=t0<t1<…<tN=T}且|π|<δ(?)及t=tk-1,存在满足对i=k,...,N和m=1,2,分别有和命题3.2.1对任意的(?)>0,存在足够小的δ(?)>0使得对于任意的划分π={0=t0< t1<…<tN=T}且|π|<δ(?)及t=tk-1,存在一对控制满足对于所有的k≤i≤l≤N和m=1,2,有其中X=Xt,x,uε,vε。定理3.2.2(NEP的存在性)对于任意的初始位置(t,x) ∈[0,T]×Rn,我们的非零和微分对策的NEP是存在的。第四章:本章主要研究了在没有Isaacs条件下的非零和随机微分对策的Nash均衡支付的存在性问题。我们首先研究了相关的零和随机微分对策的值函数的存在性;其次给出非零和随机微分对策Nash均衡支付的刻画,进而证明了Nash均衡支付的存在性。我们的动态系统是如下双受控随机微分方程:零和随机微分对策:对于(t,x)∈[0,T]×Rn,π={0=t0<t1<…<tN=T}和我们定义代价泛函为伴随划分π的上下值函数:在没有Isaacs条件下,我们通过研究上下值函数Uπ和Wπ来得到零和随机微分对策值函数的存在性。为此,我们首先采用Buckdahn,Li[16]中引入的方法,证明了上值函数Uπ和下值函数Wπ是确定性的。其次证明了上下值函数Uπ和Wπ关于划分节点满足动态规划原理。最后,结合倒向随机微分方程理论,我们证明了当划分π的细度趋于0时,函数Wπ和Uπ一致收敛于同一个函数,且此函数是相关的Hamilton-Jacobi-Bellman-Isaacs(简记为HJBI)方程的唯一粘性解。定理4.2.1对所有的(t,x) ∈[0,T]×Rn和对于[0,T]的任意划分π,我们有定理4.2.2设〗={0=t0<t1<…<tN=T),t ∈[tk-1,tk),x ∈Rn。则对所有的k≤l≤N,我们有,P-a.s.,引理4.2.1对所有的(t,x) ∈[0,T]×Rn,成立命题4.2.1对[0,T]的所有划分π,存在一常数C>0使得对于所有的t,r ∈[0,T],x,y ∈Rn,我们有定理4.2.3(值函数的存在性)存在一有界连续函数V:[0,T]×Rn→R使得,对于[0,T]的所有划分序列πn且|πnl→ 0,当n→+∞时,上下值函数(Vπn,Wπn)在[0,T]×R“的紧集上一致收敛于(V,V)。此外,函数V是HJBI方程(4.2.52)的唯一粘性解。非零和随机微分对策:对任意给定的(t,x) ∈[0,T]×Rn和划分π={0=t0<t1< ...<tN=T},t ∈[tk-1,tk),我们定义代价泛函为两个竞争者的目标均是最大化其代价泛函。为得到NEP的存在性,我们分别介绍与g1和g2相联系的值函数W1(t,x)和W2(t,x):引理4.3.2 a)设(t,x) ∈[0,T]×Rn,ε>0。对于任意的划分π={0=t0<t1<...< tN=T)且|π|<δε(δε>0足够小),t=tk-1,及对任意给定的存在NAD策略αi ∈At,Tπ,i=k-1,...,N,使得对于所有的有αi(v)三u’,在[t,ti]上,b)设(t,x)∈[0,T]×Rn,∈>0.对于任意划分π={0=t0<t1<…<tN=T),且|π|<δε(δε>0足够小),t=tk-1,及对任意给定的u’ ∈ut,Tπ,存在NAD策略αi ∈At,Tπ,i=k-1,...,N,使得对于所有v ∈Vt,Tπ,P-a.s.,有αi(v)三u’,在[t,ti]上定理4.3.1(NEP的刻画)(e1,e2) ∈R2是初始数据为(t.x)的一个NEP,当且仅当对任意的(?)>0,存在足够小的δ(?)>0,使得对任意划分π={0=t0<t1<...<tN=T}且|π|<δε,t=tk-1,存在一对可容许控制(使得,对i=k-1,....N和m=1,2,分别有命题4.3.1对任意的(?)>0,存在足够小的δ(?)>0使得,对任意划分π={0=t0< t1<…<tN=T}且|π|<δε,t=tk-1,存在一对控制使得,对所有的k-1≤i≤l≤N和m=1,2,分别有其中X=Xt,x,uε,vε。定理4.3.2 (NEP的存在性)对于任意初始位置(t,x) ∈[0,T]×Rn,我们的非零和随机微分对策的NEP是存在的。第五章:在本章中,我们考虑一类新型的反射平均场倒向随机微分方程,即与值函数耦合的受控的反射平均场倒向随机微分方程。利用逼近的方法,我们不仅证明了此类方程解的存在唯一性,而且给出了相关的比较定理。通过推广Peng在[104]中引入的随机倒向半群,我们证明了相关的动态规划原理。最后,我们证明了与反射平均场倒向随机微分方程耦合的值函数是相关的带障碍的非局部偏微分方程的唯一粘性解。McKean-Vlasov随机微分方程:给定(x0,v) ∈Rn×V0.T,对所有的t ∈[0,T],ζ ∈ L2(Ω,Ft,P)和v(·) ∈Vt,T,考虑如下随机微分方程:在假设(H5.2.1)下,此方程存在唯一解Xt,ζ;v ∈SF2(t,T;Rn)。考虑如下形式的反射平均场倒向随机微分方程,即与其值函数耦合的受控的反射平均场倒向随机微分方程:我们利用迭代的方法证明上述方程解的存在性。令Yt,x;v,0≡0,m≥1,对于(t,x)∈[0,T]×Rn,u ∈Vt,T,考虑如下迭代方程引理5.2.1对所有的m≥1,上述迭代方程存在唯一的解进一步,函数Wm:Ω×[0,T]×Rn→R满足(i)Wm(t,x)是Ft-可测的,(t,x) ∈[0,T]×Rn;(ii)存在一常数C独立于m,使得对于所有的t ∈[0,T],x,x ∈Rn,P-a.s.,定理5.2.1(存在性)对所有的(t,x) ∈[0,T]×Rn,u ∈Vt,T,存在一三元组使得在中收敛到(Yt,x;v),Zt,x;v,Kt,x;v),且Wm(t,x),m≥1,在L2中收敛到进一步,是反射平均场倒向随机微分方程(5.2.3)的解,且存在一常数C>0使得对于t ∈[0,T],x,x ∈Rn,P-a.s.,有定理5.2.2(唯一性)在假设(H5.2.1)和(H5.2.2)下,与值函数耦合的反射平均场倒向随机微分方程(5.2.3)的解是唯一的。定理5.2.3(比较定理)对于i=1,2,我们假设系数fi=fi(t,x’,x,y’,y,z)和障碍hi(t,x’,x)满足假设(H5.2.2)和(H5.2.3),终端值分别是带有数据(fi,ζi,hi)的反射平均场倒向随机微分方程(5.2.3)的唯一解。进一步,设ζ1≥ζ2,h1≥h2,f1≥f2,则且定理5.3.1(DPP)在假设(H5.2.1)和(H5.2.2)下,对于所有的t∈[0,T),x∈Rn,0≤δ<T-t,值函数W(t,x)有如下动态规划原理:定理5.4.1(i)(存在性)在假设(H5.2.1)和(H5.2.2)下,由反射平均场倒向随机微分方程(5.2.3)给出的值函数W ∈Cp([0,T]×Rn)是PDE(5.4.1)的一个粘性解。(ii)(唯一性)在(?)空间中,(i)中的值函数W是PDE(5.4.1)的唯一粘性解。
其他文献
目的:观察及分析尼可地尔在冠心病患者中应用效果情况。方法:纳入对象是140例冠心病者,这些患者采取两种模式进行治疗,以比较治疗的成效。其中一部分患者(研究组)应用常规治
针对传统的主备切换方法只能支持双机,仅支持心跳一种判断标准,需要人工介入进行切换,且存在单点故障等问题,提出了一种基于细粒度应用管理的多机主备冗余机制。该机制通过使
目的探讨人乳头瘤病毒(HPV)感染的基因型分布情况及临床意义。方法采用基因芯片技术对134例患者宫颈上皮细胞标本进行23种基因型别的检测,并对受检者进行相关资料分析。结果 13
目的探讨无症状长期吸烟者肺小气道损害的患者进行吸气相CT扫描,结合呼气相HRCT扫描,评价呼气相HRCT影像表现及相关参数在诊断小气道疾病方面应用价值。方法采用70例作为吸烟
许多文献从资源基础理论(RBV)角度研究了战略联盟形成机理,但是很少有文献能够对此进行实证分析,专利引用分析提供了一个对战略联盟进行量化研究的独特视角.研究表明,具有相
目的探讨临床路径在神经外科介入治疗中的临床应用,为神经外科介入治疗的规范化提供依据。方法以神经外科2013和2014年行介入治疗的患者为研究对象,分为对照组和观察组,每组4
“为什么要学习历史?”  “因为‘读史可以明智’啊”,以前不管是别人问我还是我问别人这个问题,大家都是这么说,好像培根的这句名言就是标准答案。其实我对这个答案一点也不满意,一句话来应付这么复杂的问题,像是在敷衍了事,很难解开提问人心中的困惑。我做了教师后,暗下决心要找到学生满意的答案。近年来读书看报时我欣喜地发现和这个问题有关的名人名言有很多,于是做了个有心人,收集整理了不少,期待和大家分享。  
目的探讨骨髓间充质干细胞(bone marrow mesenchymal stem cells,MSCs)移植到心肌梗死大鼠后在心肝脏器的分布及对其功能的影响。方法建立心肌梗死大鼠模型,1周后将标记的MSCs
目的研究回肠袢式造口术对梗阻性直乙状结肠癌患者生活质量及安全性影响。方法选取2011年7月至2014年7月收治的54例梗阻性直乙状结肠癌患者,按照随机数表法将本次研究对象分
昌吉州具有悠久的养兔历史,但是长期以来处于散养,致使生产力水平不高,经济效益低下。随着新疆农业产业结构调整,如何实现广大农牧民经济收入增长,是一个非常重要的课题。“