部分信息下正倒向随机系统的最优控制和微分对策理论

来源 :山东大学 | 被引量 : 0次 | 上传用户:mir_lww0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
倒向随机微分方程是一个带终端条件而不是初始条件的Ito型随机微分方程。倒向随机微分方程的线性形式由Bismut[7]引入,而非线性形式由Pardoux和Peng[39]、Duffie和Epstein [13]分别独立引入。倒向随机微分方程与一个正向随机微分方程相藕合,形成了一个正倒向随机微分方程.自从被引入以来,正倒向随机微分方程在许多不同领域,特别在随机控制、金融数学方面备受关注。比如:源自随机最优控制的经典的哈密顿系统就是一类正倒向随机微分方程;用于期权定价的Black-Scholes公式能够通过正倒向随机微分方程来表示得到。有关正倒向随机微分方程的更多内容,参见Ma和、’ong [34]、Yong和Zhou[70]的专著。由于正倒向随机微分方程是很好的动态系统,我们很自然地去考虑其系统下的随机最优控制和微分对策问题。本文将致力于研究完全和部分信息下的正倒向随机微分方程的随机滤波、最优控制和微分对策。Wang和Wu[54]首先研究了系统状态和观测方程由布朗运动所驱动的正倒向随机系统的滤波理论.他们提出了一种倒向分离的技术,而这种技术在解决部分可观的最优控制问题时比Wonham[59]的分离原理更方便.受Wang和Wu的工作的启迪,我们研究了系统状态和观测方程由布朗运动和泊松过程联合驱动的正倒向随机系统的滤波方程,并将其应用到一类带随机跳的部分可观的最优控制问题。由于泊松过程随机跳跃的性质,我们得到了不同于Wang和Wu[54]的一些新的有趣的结果。Shi和Wu[47]研究了一类带随机跳的部分藕合的正倒向随机微分方程的最优控制问题,Wu[61]研究了不带跳的部分可观的正倒向随机微分方程的最优控制,他们都要求控制域是凸的.Wang和Wu[55]则研究了控制域非凸、正向方程扩散项系数不含控制变量的部分藕合的正倒向随机系统的部分可观的最优控制问题。基于前面的工作,Xiao[63]考虑了带有随机跳跃的部分藕合正倒向随机系统、控制域是凸的情况下的部分可观的最优控制问题,得到了最优控制需要满足的一个必要条件和充分条件,将Shi和Wu[47]推广到部分可观的情况,将Wu[61]推广到随机跳的情况,也部分推广了Liptser和Shiryayev [33],Bensoussan [6], Tang [50], Wang和Wu[54,55]的结果到随机跳或者正倒向系统的情形。然而,前述工作都没有考虑状态和观测有相关噪声的情形。据我所知,目前仅有Tang[50]考虑了正向连续状态与观测过程具有相关噪声的情况,得到了一般的随机最大值原理。在这里,我们研究了具有相关噪声的、带有随机跳跃的正倒向随机系统的最优控制问题.在凸控制域的条件下,我们得到了一个最大值原理和一个验证定理.当前的工作能够包含Shi和Wu[47]、Wu[61]的结果,能够部分推广Shi和Wu[48]、Wang和Wu[55]到随机跳跃,Tang和Hou [51]、Xiao[63]到相关噪声,Tang[50]到正倒向跳扩散系统,Peng[41]到部分信息的情形.到目前为止,仅有两篇文章考虑倒向随机微分方程的微分对策问题:一篇是Yu和Ji[72],运用完全平方技术研究了线性二次非零和微分对策,得到了一个显式的纳什均衡点;另一篇是Wang和Yu[56],研究了非线性倒向随机微分方程的微分对策问题,以最大值原理的形式给出了纳什均衡点的充分和必要条件。上述对策问题都局限于倒向系统的研究,据我所知,Buckdahn和Li[8]、Yu[71]研究了正倒向系统的微分对策问题。在Buckdahn和Li[8]里,对策系统的值函数通过倒向方程在零时刻的解定义,进而证明了一个动态规划原理,并揭示对策的上下值函数是Hamilton-Jacobi-Bellman-Isaacs方程唯一的粘性解。最近,Yu[71]研究了正倒向系统线性二次非零和的对策问题.在本文,我们将要研究的是更一般的情形,即非线性的部分藕合的正倒向随机微分方程的微分对策问题,联合正倒向随机微分方程理论和经典的凸变分技术,得到了非零和对策均衡点与零和对策鞍点的最大值原理和验证定理。为了更好地刻画市场中所谓的非正常交易现象(比如内部交易)以及寻找部分信息倒向重随机微分方程线性二次非零和微分对策均衡点的显式解,我们关心一类新的部分信息下起始点藕合的正倒向重随机微分方程的微分对策问题。这类问题具有更广泛的理论和实际意义。首先,正倒向重随机系统包含许多系统作为它的特例。例如:如果我们去掉倒向Ito积分项,或者正向方程,或者两者同时去掉,则正倒向重随机系统退化为正倒向随机系统,或者倒向重随机系统,或者倒向系统;其次,所有的结果能够退化成完全信息的情形;最后,如果当前的零和随机微分对策仅有一个参与者,则对策问题退化成一些相关的最优控制问题。更详细说的话,我们的结果是如下一些研究工作的部分推广:部分信息倒向随机微分方程和正倒向随机微分方程的最优控制(见Huang, Wang和Xiong [20], Xiao和Wang [64]),完全信息的倒向重随机微分方程的最优控制(见Han, Peng和Wu[18]),完全信息和部分信息的倒向随机微分方程的微分对策(见Wu和Yu[56],Yu和Ji[72]Zhang [73],Wu和Yu[57]).本文共分四章,主要结果如下。第一章:我们对第二到第四章研究的问题进行了简要的介绍。第二章:我们研究了线性的带随机跳跃的正倒向随机微分方程的随机滤波。通过应用得到的滤波方程,我们求解了一个部分可观的线性二次的最优控制问题,得到了一个显式可观的最优控制。定理2.1设条件(H2.1)和(H2.2)成立,方程(2.14)存在解,则状态(x,y,z1,z2,r1,r2)的滤波估计(πt(x),πt(y),πt(z1),πt(z2),πt(r1),πt(r2))由(2.14),(2.22)和(2.23)表出,滤波估计πt(x)的条件均方误差由(2.21)表出.推论2.1假定a6(·)=a10(·)三0,即x(·)和N1(·)不会同时发生跳跃,则(2.14)变为(2.22),(2.23)和(2.21)仍然成立,其中相应的a6(·)和a10(·)由零代替。推论2.2如果c5(·)三0,即观测过程Z(·)不会发生跳跃,则(2.24)仍是相应的滤波方程,(2.22),(2.23)和(2.21)仍然成立.定理2.2设条件(H2.1)-(H2.3)成立.则对任意的v(·)∈Uad,方程(2.30)的解xv(·)有滤波估计和这里采用了记号γ(t)=E[(xv(t)-πt(xv))2[FtZ].定理2.3设条件(H2.1)-(H2.4)成立,则(2.44)式表示的u(·)是前述的部分可观的最优控制问题的真正的最优控制。定理2.4设条件(H2.1)-(H2.4)成立,则最优控制u(·)和相应的泛函指标J(u(·))各由(2.44)和(2.54)表示。第三章:我们研究了带随机跳跃的部分可观的正倒向随机微分方程的最优控制问题,就状态和观测不相关和相关两种情况进行了分别讨论。我们以最大值原理形式确立了两种情况下最优控制的必要条件和充分条件,并举了两个例子来说明理论的应用。引理3.1设条件(H3.1)成立,则有引理3.2设条件(H3.1)成立,则有引理3.3设条件(H3.1)成立,则有如下的变分不等式成立:定理3.1设条件(H3.1)成立,u(·)是我们随机最优控制问题的最优控制,(x(·),y(·),z(·),r(·,·))是相应的最优轨迹,(p(·),q(·),k(·),L(·,·))是方程(3.19)的解。则我们有定理3.2设(H31)和(H3.2)成立,zv(·)是FtY适应的,u(·)∈Uad是一个容许控制,(x(·),y(·),z(·),r(·,·))是其相应的轨迹.另设β(·)和(p(·),g(·),k(·),L(·,·))各自满足(3.17)和(3.19),哈密顿函数H关于(x,y,z,r,v)是凸的,且那么u(·)是一个最优控制。定理3.3系统满足(3.30)和(3.33),容许控制集Ud如(3.32)定义,选取v(·)∈Uad使(3.29)所表示的消费泛函达到最小,这表示了一个部分可观的最优控制问题,那么如(3.35)中所示的候选最优控制u(·)是想要的唯一最优控制,其显式表达如(3.57)所示。定理3.4设条件(H3.1)成立,容许控制集Uad如(3.1)定义,u(·)是一个最优控制,{p,(Q,K,K,R),(q,k,k,r)}是方程(3.68)在控制u(·)下相应的Ft适应的平方可积的解,则最大值原理对任意的v(·)∈Uad都成立。定理3.5设条件(H3.1)和(H3.2)成立,pv(·)是FtY适应的,u(.)∈Uad是一个容许控制,其相应的状态轨迹为(x(·),y(·),z(·),z(·),r(·,·)).又设{p,(Q,K,K,R),(q,k,k,r)}是方程(3.68)的解,哈密顿函数H(t,u(t))关于(x,y,z,z,r,v)是凸的,且有则u(·)是一个最优控制。第四章:我们首先研究了终端藕合的正倒向随机微分方程的微分对策问题,给出了最大值原理形式的必要性条件和充分条件。这个研究的动机之一是为了寻找非线性期望下线性二次零和微分对策鞍点的显式解。为了更好刻画所谓市场中非正常交易现象(比如内部交易)以及寻找部分信息倒向重随机微分方程线性二次非零和微分对策均衡点的显式解,我们接着研究了一类新的部分信息下起始点藕合的正倒向重随机微分方程的微分对策问题。对非零和对策的纳什均衡点和零和对策的鞍点,我们都给出了必要性条件和充分性条件。引理4.1设条件(H4.1)成立,则对i=1.2,有下式成立:引理4.2设条件(H4.1)和(H4.2)成立,则对i=1,2,下述的变分不等式成立:定理4.1设条件(H4.1)和(H4.2)成立,(u1(·),u2(·))是问题Ⅰ的一个均衡点,(x(·),y(·),z(·))和(pi(·),qi(·),ki(·))是(4.10)和(4.23)相应的解,则有和对任意的(v1(·),v2(·))∈U1×U2,a.e.a.s..成立。定理4.2设条件(H4.1),(H4.2),和(H4.3)成立,(u1(·),u2(·))∈U1×U2是一个容许控制,(x,y,z)和(pi,qi,ki)方程(4.10)和(4.23)相应的解.假定对任意的(t,a,b,c)∈[0,T]×Rn×Rm×Rm×d存在,对任意的t∈[0,T],关于(a,b,c)是凹的(Arrow条件),且则(u1(·),u2(·))是问题Ⅰ的一个均衡点.定理4.3设条件(H4.1)和(H4.2)成立,(u1(·),u2(·))∈U1×U2是问题Ⅱ的一个鞍点,(x,y,z)和(p,q,k)是方程(4.10)和(4.23)的解,这里的哈密顿函数H1和H2如(4.37)和(4.38)定义.则有和对任意的(v1(·),v2(·))∈U1×U2,a.e.a.s.成立。定理4.4设条件(H4.1),(H4.2)和(H4.3)成立,(u1(·),u2(·))∈U1×U2是一个容许控制,(x,y,z)和(p,q,k)是方程(4.10)和(4.41)的解。假定哈密顿函数H满足如下的条件最小最大值原理:(ⅰ)设φ和γ都是凹函数,对任意的(t,a,b,c)∈[0,T]×Rn×Rm×Rm×d存在,且关于(a,b,c)是凹的.则对任意的v2(·)∈U2,有和成立。(ⅱ)设φ和γ都是凸函数,对任意的(t,a,b,c)∈[0,T]×Rn×Rm×Rm×d成立,关于(a,b,c)是凸的.则对任意的v1(·)∈U1,有和成立。(ⅲ)设(ⅰ)和(ⅱ)都成立,则(u1(·),u2(·))是一个鞍点,且定理4.5设条件(H4.4)成立,(u1(·),u2(·))是问题(NZSG)的一个均衡点,而且(y(·),z(·),Y(·),Z(·))和pi(·),pi(·),qi(·),qi(·))是方程(4.62)和(4.63)相应于(u1(·),u2(·))的各自的解。则有和对任意的(v1(·),v2(·))∈U1×U2,a.e.a.s.成立。推论4.1设条件(H4.4)成立,对任意的t∈[0,T],εt=Ft,(u1(·),u2(·))是问题(NZSG)的均衡点,而且,(y(·),z(·),Y(·),Z(·))和(pi(·),pi(·),qi(·),qi(·))是方程(4.62)和(4.63)相应于(u1(·),u2(·))的各自的解。则有和对任意的(v1(·),v2(·))∈U1×U2,a.e.a.s.成立.定理4.6设条件(H4.4)和(H4.5)成立,(y,z,YZ)和(pi,pi,qi,qi)是方程(4.62)和(4.63)相应于(u1(·),u2(·))的解。假定φi和γi各自关于Y和y(i=1,2)是凹的,对任意的(t,y,z,Y,Z,)∈[0,T]×Rn×Rn×1×Rm×Rm×d,(y,z,Y,Z,v1)→H1(t,y,z,Y,Z,v1,u2(t),p1(t),p1(t),q1(t),q1(t)),(y,z,Y,Z,v2)→H2(t,y,z,Y,Z,u1(t),v2,p2(t),p2(t),q2(t),q2(t))是凹的,而且,则(u1(·),u2(·))是问题(NZSG)的均衡点。
其他文献
本文从六个方面阐述了地图形式美的规律性,最后进一步说明了其规律性与增强地图美感的关系。
目的探究不同置入途径髓内针内固定治疗胫骨骨折对患者膝关节功能的影响。方法研究对象选取为2012年4月~2017年11月之间舞阳县人民医院收治的84例胫骨骨折患者,采用数字表法随
【正】 我是大隆机器厂的一个車工。一九五四年企业公私合营以来,我加工过許多簡单、普通的产品,也加工过一些此較复杂和精密的产品。由于我在党的不断教育下,平时比較认真地
随着20世纪90年代不断深入的金融一体化以来,国与国之间资金的流动不仅仅是由于相互贸易的需要,还出现了以持有金融资产来分散风险和增加收益为目的的国际资本流动。美国累积
以甘露醇为基体改进剂,建立石墨炉原子吸收光谱法测定压水反应堆硼酸介质中钙含量的方法。考察基体改进剂用量、灰化温度、原子化温度、基体干扰以及共存离子干扰对测定结果
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
《汉语大词典》的释义错误有5类。一、望文生训,释义舛错:利、辄、录、陇、菁、九原、玉人、杏眼、讽怨、瓦解;二、以偏概全,词义残缺:烽、烽火、朵颐、捣衣、黄鸡、断山、积
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
期刊
目的:探讨下肢全长拼接摄影下肢轴线测量的准确度。方法:采用岛津公司Sonialvision SafireⅡ型全数字化大平板透视-摄影系统所配备的肢体全长成像技术对人体下肢骨骼标本进行标
<正>尸冷分析是一个半世纪以来推测死亡时间的重要方法。早期的研究者采用腋窝温度,但现在多采用直肠温度,因为直肠是反应体内温度
会议