延迟随机最优控制与微分对策问题研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:nhk1970
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本篇论文主要研究了带延迟的随机最优控制问题和随机斯塔克尔伯格微分博弈问题。我们建立了一般最大值原理、最大值原理与动态规划原理之间的关系、验证定理,得到了反馈控制、开环策略,讨论了闭环可解性。我们还将这些理论结果应用于实际问题,如最优投资问题、生产消费问题、资源分配问题等。经济金融、航空航天、网络通信等领域的许多问题都可以转化为最优控制问题,然而,现实世界中某些现象的发展不仅仅依赖于当前时刻的状态,也依赖于过去的历史状态。比如由于信号传输的速度有限,穿越长距离通信所需的时间是不可忽视的,或者通过队列所需的时间是不可忽视的。再比如在液压控制系统中,非瞬时的人类反应或化学反应会造成时间延迟,材料的粘弹性效应也会造成时间延迟。因而研究带延迟的最优控制问题具有十分重要的理论意义和应用价值。在现实生活中,我们不仅要根据自己掌握的信息和自己的行为优化自己的指标泛函,还要受别人信息的影响与别人的行为发生相互作用,做出更有利于自己的决策。斯塔克尔伯格微分博弈就是描述参与者信息或者地位不对等情况下进行的博弈问题,在斯塔克尔伯格微分博弈问题中有两位玩家,一位是领导者,另一位是跟随者,当领导者知道跟随者的理性反应并首先揭示其策略时,跟随者不知道领导者的理性反应并且必须在给定的领导者的控制下优化其策略,斯塔克尔伯格策略就是两位参与人的理性解。因而研究带延迟的斯塔克尔伯格微分博弈问题具有深刻的理论价值和重大的现实意义。接下来我们给出本文的主要研究内容和具体的组织结构。论文的第一章介绍了后面五章所涉及问题的研究背景、研究目的、研究意义、研究现状、研究内容以及创新点和主要贡献。论文的第二章研究了一个带延迟的随机最优控制问题,其中控制域非凸,扩散项既包含控制又包含控制延迟。受相关文献的启发,我们将彭随机最大值原理推广到延迟系统,不带延迟部分最大值条件的刻画与彭最大值原理类似,而带延迟部分的最大值条件需要借助条件期望、示性函数和特殊的超前倒向随机微分方程来刻画。通过引入一个特殊的倒向随机微分方程,我们克服了应用对偶技巧时交叉项带来的困难。进一步为了解释理论结果的应用,我们研究了三个动态最优化问题。论文的第三章研究了一个带混合延迟的随机递归最优控制问题。我们得到了粘性解框架下最大值原理和动态规划原理之间的关系,它可以帮助寻找最优控制。我们也给出验证定理来帮助验证一个容许控制是否是真正的最优控制。论文的第四章研究了一个带延迟倒向随机微分方程驱动的线性二次最优控制问题。我们得到了最优控制的显式表达,它是整个历史状态轨迹和将来一小段时间状态期望值的线性反馈。为了得到最优反馈,我们引入一类新的带延迟Riccati方程和一类新的延迟-超前正倒向随机微分方程,最后我们讨论了它们的可解性。论文的第五章研究了一个带延迟的线性二次随机斯塔克尔伯格微分博弈问题。我们的模型非常一般,状态延迟和控制延迟同时出现在状态方程中,而且同时进入扩散项。通过引入两个伪Riccati方程和一个特殊的矩阵方程,我们克服了扩散项中控制延迟带来的困难进而得到了开环斯塔克尔伯格策略的状态反馈表示。最后我们应用前面的理论结果解决了一个资源分配问题。论文的第六章研究了一个含状态延迟的时变系数线性二次最优控制问题,其中不仅包含点延迟还包含平均延迟。通过将原带延迟有限维问题提升为无穷维空间上不带延迟的控制问题,我们给出原问题开闭环可解的定义。通过三个等价的积分型算子值Riccati方程和两个等价的倒向积分型发展方程,我们得到了闭环可解的充要条件。上面结果并不直观因为它是用许多算子来描述的,通过一些耦合的矩阵值Riccati方程和耦合的偏微分方程,我们给出前面结果的显式表达。接下来我们给出本篇论文的主要结论。1.带延迟随机最优控制问题的一般最大值原理假定U ?Rk是非空的,δ>0是给定的常数,表示延迟时间,考虑下面带延迟的随机控制系统:(?)(0.0.1)和代价泛函:J(v(·))=E[∫0Tl(Tt,X(t)X(t-δ),v(t),v(t-δ))dt+h(x(T))].(0.0.2)定义容许策略集为:uad:={v(·)|v(·)是一个U-值,平方可积,Ft-可料过程.问题(P).我们的目标是在uad中寻找一个控制u(·),使得(0.0.1)满足并且(0.0.2)最小化。下面引理给出变分方程(2.3.2)和(2.3.3)的估计。引理0.1.假设条件(A2.1)成立。假定x(·)是最优轨迹,xε(·)是与容许控制uε(·)相对应的状态轨迹,那么对任意p ≥ 1,下面估计成立:(?),(0.0.3)(?),(0.0.4)(?),(0.0.5)(?)(0.0.6)(?)(0.0.7)下面引理给出变分不等式。引理0.2.假设条件(A2.1)成立。假定(u(·),x(·))是最优对,xε(·)是与uε(·)相对应的最优轨迹,uε(·)如(2.3.1)所定义。那么下面变分不等式成立:(?)(0.0.8)由引理0.1和引理0.2可得第二章的主要结论:一般最大值原理。定理0.1.假设条件(A2.1)成立。假定(u(·),x(·))是最优对,假定对任意t ∈(R,T+δ],lxδ(t)=lxδxδ(t)=0.假定(p(·),q(·))∈ SF2([0,T];R)× LF2([0,T];R),(P(·),Q(·))∈SF2([0,T];R)× LF2([0,T];R)分别满足ABSDE(2.3.12)和(2.3.13).除此之外,假定(K(·),K(·))满足BSDE(2.3.14)并且对任意t∈[0,T],K(t)=K(t)=0.那么如下的最大值条件成立:H(τ,x(τ),x(τ-δ),v,u(τ-δ),p(τ),q(τ),P(τ))+EFτ[H(τ+δ,x(τ+δ),x(τ),u(τ+δ),v,p(τ+δ),q(τ+δ),P(τ+δ))]I[0,Τ-δ)(τ)≥H(τ,Θ(τ),p(τ),q(τ),P(τ))+EFτ[H(τ+δ,Θ(τ+δ),p(τ+δ),q(τ+δ),P(τ+δ))]I[0,Τ-δ)(τ),? v ∈ U,a.e.τ ∈[0,T],P-a.s.,(0.0.9)其中H是由(2.3.25)式定义的哈密顿函数。2.粘性解框架下的带延迟随机递归最优控制问题固定延迟时间δ>0,对任意(s,φ)∈[0,T)× C([-δ,0];R),考虑下面受控的耦合正倒向混合时滞随机微分方程(FBSMDDE):其中X1s,φ,u(t):=∫-δ0eλτXs,φ,u(t+τ)dτ,X2s,φ;u(t):=Xs,φ;u(t-δ).(0.0.11)引入如下代价泛函:J(s,φ;u(·)):=-Ys,φ;u(s),(s,φ)∈[0,T]×C([-δ,0];R).(0.0.12)问题(p).给定(s,φ)∈[0,r]× C([-δ,0];R),目标是寻找 u*(·)∈uω[s,T]使得(0.0.10)存在唯一解且(?)(0.0.13)下面定理给出伴随变量和值函数之间的关系:定理0.2.假设条件(H3.1)-(H3.2)成立。给定(s.x,x1)∈1x∈[0,T]×R2,假设u*(·)是最优控制,三元组(X*(·),Y*(·),Z*(·))是对应的最优轨迹,V(·,·,·)∈ C([0,r]×R2;R)是值函数,假定 γ(·)∈ SF2([s,T];R),(p(·),a(·))∈SF2([s,T];R3)× LF2([s,T];R2)分别满足伴随方程(3.2.8),(3.2.9),进一步假定对任意t∈[s,Tr],p3(t)≡0,那么{p1(t)γ-1(t)} ?Dx,1+V(t,X*(t),X*(t)),(0.0.14)Dx1,-V(t,X*(t),X1*(t))?{p1(t)γ-1(t)},对任意 t∈[s,T],P-a.s.,其中X1*(t):=∫-δ0eλτX*(t+τ)dτ,X2*(t)=X*(t-δ).考虑FBSMDDE(0.0.10)的一个特殊情况:下面给出与状态方程(0.0.15)相联系的问题(P)对应的验证定理。定理0.3.假定b,σ,φ满足(H3.1),a,Φ满足(H3.2),g(·)三0,f(·)是给定的一致有界确定性函数。假定V(·,·,·)∈C([0,T]×R2;R)仅依赖于(s,x,x1),而且它满足对某个k≥ 1,对任意(t,x,x1)∈(0,T)× R2,都有 |V(t,x,x1)|≤C(1+|x|k+|x1|k),除此之外V(·,·,·)还是下面HJB方程的粘性解:其中广义哈密顿函数G:[0,T]×R×R×R×U×R×R× R×R×R→R定义为(?)(0.0.16)那么我们有V(s,x,x1)≤ J(s,φ;u(·)),对任意(s,φ)∈[0,r]×C([-δ,0];R),u(·)∈uw(s,T).(0.0.17)进而,固定(s,x,x1,x2)∈[[0,T]×R3,假定(X*(·),Y*(·),Z*(·),u*(·))是一个容许对,存在四元组(Θ,p,q,P)∈ LF2([s,T];R)×LF2([s,T);× LF2([s,T];R)× LF2([s,T];R)满足:(Θ,p,q,P)∈Dt+,x1,2,1+V(t,X*(t),X1*(t)),a.e.t ∈[s,T],P-a.s.,(0.0.18)E∫sT[Θ(t)-G(t,X*(t),X1*(t),X2*(t),u*(t),-V(t,X*(t),X1*(t)),-p(t),-P(t),-q(t))]dt ≤0.(0.0.19)那么(X*(·),Y*(·),Z*(·),u*(·))是最优对。定理0.4.假定在定理θ.3中,g(·)是任意给定的一致有界确定性函数,对应的HJB方程变为(3.4.2),而(3.4.7)变为如下形式:E[exp{∫sTg(r)dW(r)-1/2∫sT|g(r)|2dr}∫sT[Θ(t)-G(t,X*(t),X1*(t),X2*(t),u*(t),-V(t,X*(t),X1*(t)),-pt),-P(t),-q(t))]dt]≤0.此时我们仍然可以得到和定理0.3相同的结论。3.带延迟倒向随机微分方程驱动的线性二次最优控制问题给定s∈[0,T),考虑下面受控的含延迟线性倒向随机微分方程:和代价泛函:(?)(0.0.21)容许控制集为如下集合:u[s,r]:={u:[s[s-δ,T × Ω→Rd| 当t∈s-δ,s)时,u(t)=η(t);当t∈[s,T]时,u(t)是一个Ft-可料过程,E∫sT |u(t)|2dt<∞}.问题(D-BSLQ).给定 s∈[0,T),ξ∈L2(Q,FT,P;Rn),寻找u*(·)∈u[s,T]使得现在我们给出如下结果来保证(0.0.20)解的适应性:定理0.5.假设条件(A4.1),(A4.2)成立,δ充分小。那么对任意(ξ,u(·))∈L2(Ω,FT,P;Rn)×u[s,T],状态方程(0.0.20)存在唯一适应解(Yu(.),Zu(·))∈SF2([s,T];Rn)×LF2([s,r];Rn).而且存在常数K>0,不依赖于ξ和u(·),使得下面定理给出问题(D-BSLQ)最优控制满足的必要条件。定理 0.6.假设条件(A4.1)-(A4.3)成立,δ充分小。假定对任意t∈[T,r+δ],Q(t)=R(t)=N(t)=0,假定u*(·)是最优控制,(Y*(·),Z*(·))是对应的最优状态轨迹。那么下面方程存在唯一解X*(·)∈SF2([s,T];Rn):最优控制可以表示为u*(t)=N-1(t)C(t)TX*(t)+EFt[(CTX*)|t+δ]},a.e.t ∈[s,T],P-a.s.(0.0.25)下面定理给出问题(D-BSLQ)最优控制的线性反馈形式。定理 0.7.假设条件(A4.1)-(A4.3)成立,δ 充分小。假定 ∑(·)∈C([s,r];S+n),L(·)∈C([s,T];S+n),S(·)∈ SF2[s,T];Rn),(X(·),A(·),r(·))∈SF2([s,T];Rn)×SF2([s,T];Rn)×LF2([s,r];Rn)分别是(4.3.1),(1.3.3),(4.3.5),(4.3.4)的解,假定对任意 t ∈[s,s+δ],A(t)=B(t)=C(t)=0,对任意t∈[T,T+δ,Q(t)=R(t)=N(t)=A(t)=B(t)=C(t)=0,并且A(t+δ)∑(t)+B(t+δ)∑(t)M-1(t)B(t)T+C(t+δ)N-1(t)C(t)T=0,t∈[s-δ,T].(0.0.26)那么最优控制可以表示为u*(t)=N-1(t){-C(t)TL(t)Y*(t)+C(t)TS(t)+EFt[(-CTLY*+ CTS)|t+δ]}I,a.e.t∈[s,T],P-a.s.(0.027)而且最优代价泛函可以表示为J(u*(·)=E{<Gφ(s-δ),φ(s-δ)>+<A(s),(I+2E(s)G)-1GA(s)>+∫s-δs[<Q(t+δ)φ(t),φ(t)>+<E(t+δ)ψ(t),ψ(t)>+<N(t+δ)η(t),η(t)>]dt+∫sT[<[R(t)+R(t+δ)]{2∑(t)[R(t)+R(t+δ)]+I}-1r(t),r(t)>+<[Q(t)+Q(t+δ)]A(t),A(t))+<X(t),[B(t)∑(t-δ)M-1(t-δ)B(t)T+C(t)N-1(t-δ)C(t)T][EFt-δ[X(t)]-X(t)]>]dt}.(0.0.28)为了研究上面定理涉及到的方程(4.3.1),(4.3.3)和(4.3.4)的可解性,我们首先考虑延迟Riccati方程(4.3.1)的可解性,为此我们需要考虑下面延迟Riccati方程:下面命题给出延迟Riccati方程(0.0.29)解的唯一性。命题0.1.假设条件(A4.1),(A4.3)成立,δ充分小。如果含延迟Riccati方程(0.0.29)的解∑(.)满足∑(·)∈ C([s,T];S+n),那么解是唯一的。如果我们可以证明含延迟Riccati方程(0.0.29)解的存在性,那么我们可以得到其解的唯一性。然而这个问题研究起来非常困难,目前我们只能处理它的特殊情况。假设iR(·)+R(·+δ)≡0,那么(0.0.29)变为(4.4.5).下面命题给出(4.4.5)的可解性。命题0.2.假设条件(A4.1),(A4.3)成立,δ充分小。假定M≥ 0是n × n对称矩阵,条件(A4.4)成立,而且B(·)=I,那么(4.4.5)存在唯一解∑(·)∈ C([s,T];S+n).进一步,假定条件(A4.5)成立,而且M>0,那么∑(·)∈ C([s,T];S+n).由上面命题可得定理0.7中延迟Riccati方程(4.3.1)的可解性。推论 0.1.假设条件(A4.1),(A4.3),(A4.4)成立,δ充分小。假定 B(·)=I,R(·)+R(·+δ)=0,那么(4.3.1)存在唯一解∑(·)∈C([s,T];S+n).下面命题给出定理0.7中Riccati方程(4.3.3)的可解性。命题0.3.假定∑(·)是(4.3.1)的解,那么Riccati方程(4.3.3)存在唯一解,而且(i)如果 G>0,那么 L(·)∈ C([s,T];S+n);(ii)如果 G ≥ 0,那么 L(·)∈C([s,T];S+n).在考虑延迟-超前正倒向随机微分方程(DAFBSDE)(4.3.4)解的存在唯一性之前,我们先研究一个更一般的方程:下面定理给出它的可解性。定理 0.8.假设条件(H4.5)-(H4.8)成立,δ充分小,假定要么L4,L6充分小,要么L2,L8充分小,那么对任意ζ ∈ L2(Ω,FT,P;Rn),DAFBSDE(0.θ.30)存在唯一解(X(·),A(·),r(·))∈SF2([s,T];Rn)× SF22[s,T];Rn)× LF2([s,T];Rn).由定理0.8立刻可以得到如下结论。推论0.2.假设条件(A4.1),(A4.3)成立,δ充分小,而且下面两个条件之一成立:(ⅰ)(?)充分小;(ⅱ)(?)充分小。那么DAFBSDE(4.3.4)存在唯一解(X(·),Λ(·),r(·))∈ SF2([s,T];Rn)× SF2([s,T];Rn)× LF2[s,T];Rn).4.带延迟线性二次随机斯塔克尔伯格微分博弈问题考虑下面带延迟的线性受控系统:领导者和跟随者的代价泛函分别如下所示:其中,X(·)∈Rn是状态过程,u1(·)∈Rk1和u2(·)∈Rk2,分别是跟随者和领导者的控制过程,φ(·)∈ C([-δ,0];Rn)是状态的初始轨迹,ηi(·)∈ L2([-δ,0];Rki),i=1,2,分别是跟随者和领导者控制的初始轨迹。我们研究的带延迟线性二次随机斯塔克尔伯格微分博弈问题具体如下:对领导者的每个决策u2(·)∈u2[0,T]:=LF2([0,T];Rk2),跟随者想要选择一个策略u1(·)∈u1[0,T]:=LF2([0,r];Rk1)使得他的代价泛函J1(u1(·),u2(·))是J1(u1(·),u2(·))在u1(·)∈u1[0,T]上的最小值。领导者事先可以知道跟随者的最优决策u1(·),领导者想要选择一个策略u2(·)∈u2[0,T]使得他的代价泛函J2(u1(·),u2(·))是J2(u1(·),u2(·))在u2(·)∈u2[0,T]上的最小值。严格来说,跟随者想要找到一个映射α1[·]:u2[0,T]→u1[0,T],而领导者想要找到一个控制u2(·)∈ u2[0,r]使得我们先处理跟随者的最优化问题,对领导者的每个决策u2(·),它是一个带延迟的线性二次随机最优控制问题。问题(F-DLQ):对任意u2(·)∈ u2[0,T],在u1(·)∈u1[0,T]上最小化代价泛函J1(u1(·),u2(·))使得(0.0.31)满足。对领导者的任意容许控制u2(·)∈u2[0,T],下面定理给出问题(F-DLQ)可解的充要条件。定理0.9.令(A5.1)成立,对任意t∈[T+δ],Q1(t)=R1(t)=0.令P1(·)满足(5.2.4)且(ζ1(·),ζ1(·))满足(5.2.5).那么对任意u2(·)∈u2[0,T],问题(F-DLQ)是可解的并且最优控制u1(·)有如下状态反馈形式:(?)(0.0.33)而且最优代价泛函可以表示为(5.2.7).接下来我们处理领导者的最优化问题。问题(L-DLQ):在u2(·)∈u2[0,T]上最小化代价泛函J2(u1(·),u2(·))使得(5.3.1)满足。下面定理给出问题(L-DLQ)可解的必要条件:定理0.10.令(A5.1)-(A5.3)成立,假定对任意t∈[T,T+δ],Qi(t)=Ri(t)=0,i=1,2.假定矩阵方程(5.3.10)和(5.3.11)分别存在唯一解L(·)和∏(·,·).令u2(·)是问题(L-DLQ)中领导者的最优控制,X(·)是对应的最优状态轨迹,那么u2(·)有下面状态反馈表示:而且领导者的最优代价泛函可以表示为(5.3.27).最后我们总结如上内容并陈述本章的主要结论。定理 0.11.令(A5.1)-(A5.3)成立,假定对任意t∈[T,T+δ],Qi(t)=Ri(t)=0,i=1,2.假定(u1(·),u2(·))是最优开环策略,矩阵方程(5.3.10)和(5.3.11)分别存在唯一解L(·)和∏(·,·),那么最优开环策略为(?)(0.0.35)u2(t-δ)=Ku2(t-δ)Φ(t|t-δ),a.e.t ∈[δ,T+δ],P-a.s.,(0.0.36)其中Φ(t|t-δ),Ku2(t-δ),K1u1(t-δ),K2u1(t-δ)的定义见(5.3.30).5.带延迟线性二次最优控制问题的闭环可解性给定s ∈[0,T)和一个延迟时间δ>0,考虑下面受控的线性延迟微分方程:其中X(.)是状态,u(·)∈ L2([s,T];Rm)是控制。∫[-δ,0]A0(t,dθ)X(t+θ)表示状态的点延迟和平均延迟,其中-δ=θN<θN-1<…<θ1<0.φ0是初始状态,φ1(·)∈ L2([-δ,0];Rn)是状态的初始轨迹。考虑下面代价泛函:H(u(·);s,φ0,φ1):=∫sT[<Q(t)X(t),X(t)+2<S(t)X(t),u(t)>+<R(t)u(t),u(t)>+2<q(t),X(t)>+2<ρ(t),u(t)>dt+<GX(T),X(T)>+2<g,X(T)>,(0.0.39)其中上式各项的定义详见(6.1.4)-(6.1.10).问题(P).对任意(s,φ0,φ1)∈[0,T)× M2,寻找u*(·)∈ L2(s,T];Rm)使得(0.0.37)满足且(?)(0.0.40)其中 M2:=Rn × L2([-δ,0];Rn).首先我们将带延迟的问题(P)转换为不带延迟的LQ问题,提升后的问题表述为:问题(EP).对任意(s,φ)∈[0,T)× M2,寻找u*(·)∈ L2({s,T];Rm)满足下面状态方程:X(t)=Φ(t,s)φ+∫stΦ(t,r)[B(r)u(r)+b(r)]dr,t ∈[s,T],(0.0.41)而且(?)(0.0.42)其中(?)(0.0.43)接下来我们通过问题(EP)来研究问题(P)的闭环可解性,因此我们引入下面定义。定义0.1.(1)问题(P)被称为在初始对(s,φ0,φ1)∈[0,T]× M2(唯一)开环可解,如果存在(唯一)一个u*(·)∈ L2([s,T];Rm)满足(0.0.42).(2)问题(P)被称为在时间s ∈[0,T)(唯一)开环可解,如果对任意(φ0,φ1)∈M2,存在(唯一)一个u*(·)∈ L2([s,T];Rm)满足(0.0.42).(3)问题(P)被称为在[s,T)上(唯一)开环可解,如果在所有t∈[s,T),它是(唯一)开环可解的。定义0.2.(1)令Ξ[s,T]:={Θ((·):[s,T]→L(M2,Rm)Θ(·)是强连续的且(?),且 Q[s,T]:=Ξ[s,T]× L2([s,T];Rm).二元组(Θ(·),v(·)∈Q[s,T]被称为[s,T]上问题(P)的一个闭环策略。(2)对任意(Θ(·),v(·))∈ Q[s,T]且(φ0,φ1)∈ M2,记(?),v(·))是下面方程的解:X(t)=Φ(t,s)φ+∫stΦ(t,r)[B(r)(Θ(r)X(r)+v(r))+b(r)]dr,t ∈[s,T],(0.0.44)记u(t)=Θ(t)X(t)+v(t),t ∈[s,T],那么(X(·),u(·)被称为(Θ(·),v(·))在[s,T]上对应初始轨迹(φ0,φ1)的导出对;X(·),u(·)分别被称为对应的闭环状态和由闭环导出的控制。(3)一个闭环策略(Θ*(·),v*(·))∈ Q[s,T]在[s,T]上被称为是最优的,如果J(Θ*(·)X*(·)+v*(·);s,φ)≤J(Θ(·)X(·)+v(·);s,φ),(?),(0.0.45)其中X*(·),X(·)分别是与(Θ*(·),v*(·),φ0,φ1)和(Θ(·),v(·),φ0,φ1)相对应的闭环状态。如果一个最优闭环策略在[s,T]上(唯一)存在,那么问题(P)被称为在[s,T]上(唯一)闭环可解。下面引理给出问题(P)开环可解的充要条件。引理0.3.假设条件(A6.1)-(A6.2)成立。对任意给定初始对(s,φ0,φ1)∈[0,T)×M2,u*(·)是问题(P)的一个开环最优控制当且仅当下面两个条件成立:(ⅰ)(稳定性条件)S0(t)X*(t)+R00(t)u*(t)+B(t)*p*(t)+ρ0(t)=0,a.e.t ∈[s,T],(0.0.46)其中(X*(·),p*(·))∈C([s,T];M2)× L∞([s,T];M2)满足下面积分方程:#12(0.0.47)(ⅱ)(凸条件)(?)(0.0.48)其中X0(·)是下面积分方程的解:X0(t)=∫stΦ(t,r)B(r)u0(r)dr,t∈[s,T].(0.0.49)借助问题(EP),我们可以得到问题(P)闭环可解的充要条件。定理0.12.假定(A6.1)-(A6.3)成立。B,R,R?连续,S00(t,θ),S01(t,θ)关于t连续,关于 θ ∈[-δ,0]一致,S0[I-R00?R00]=0,那么(Θ*(·),v*(·))是问题(P)在[s,T]上的最优闭环策略当且仅当(ⅰ)(Θ*(·),v*(·))由(6.3.44)给出,这里对任意φ∈ M2,P(·)满足积分Riccati方程(6.3.41)且η(·)满足积分方程(6.3.42),(ⅱ)R00≥ 0,R(B*P+S0)? R(R00),R(B*η+ρ0)?R(R00),(ⅲ)(Θ*(·),v*(·))∈ Q[s,T].此时值函数为(?)(0.0.50)注意到前面的结果是用许多抽象算子来表示的,最后我们给出问题(P)闭环可解的一个更直观的刻画。定理 0.13.假定(A6.1)-(A6.2)成立。假定R≥0,B(t),S00(t),S01(t,θ),R(t),R(t)?关于t连续。假设绝对连续函数P00(t),P01(t,θ),P11(t,θ,α),η0(t),η1(t,θ),t∈[s,T],θ,α∈[-δ,0],满足方程(6.3.87)-(6.3.88),P00(t)=P00(t)T,P11(t,θ,α)=P11(t,α,θ)T,且下面条件成立:(?)(0.0.51)假定(Θ*(·),v*(·))由下面两个式子来定义:(?)(0.0.52)那么(Θ*(·),v*(·))是问题(P)的最优闭环策略,值函数为(?)(0.0.53)
其他文献
始于20世纪70年代末的改革开放是中国共产党为探寻中国现代化道路所作出的重大战略决策,引发了中国的深刻变化。时至今日,中国共产党作为执政党已与国家、市场、社会形成了党全面领导下的嵌入式互动关系,党的执政能力则是贯穿其中的核心支撑力量,极大地影响着中国各项改革的政策质量、推行效率与执行效果。在海外学者看来,市场经济的引入触发了中国共产党在经济发展、思想建设、社会治理和政治改革各个领域中的系统执政挑战
学位
单晶光纤作为一种新型的功能晶体材料,兼具体块单晶与光纤材料的优势,具有物理化学性质稳定、光学质量高、掺杂浓度高、耐高温、抗氧化、比表面积大等优点,在光纤激光以及温度传感等领域具有巨大的应用前景。近年来,关于单晶光纤的研究呈现出火热的态势,包括单晶光纤生长、包层制备技术以及器件开发等方面都在不断突破。相比于国际先进研究水平,我国对于单晶光纤的研究起步较晚,仍处于探索阶段,因此开展高质量单晶光纤的制备
学位
裸甲藻亚胺毒素(Gymnodimines,GYMs)属于环亚胺类毒素(Cyclic imines,CIs),是一种由甲藻产生、广泛分布的海洋生物毒素。GYMs毒性强,有“快速作用”特征,可通过食物链或气溶胶进入生物体,对人类健康和水产养殖造成巨大危害。目前已开发的检测方法有小鼠生物法、液相色谱串联质谱法和受体结合法等,这些方法费用昂贵、操作复杂、特异性低,急需一种特异、灵敏、高效的检测方法。核酸适
学位
自从铅系有机-无机杂化钙钛矿被报道以来,ABX3型有机-无机杂化钙钛矿(A=甲胺、甲脒、铯;B=铅或锡;X=氯、溴、碘或混卤)在光电转换领域的应用已经引进了全世界科学家的广泛关注。但是铅系钙钛中的铅元素对环境有毒性,而锡系钙钛矿中Sn2+相对不够稳定,所以它们的商业化应用进展缓慢。为了解决铅系和锡系钙钛矿的本质缺点,低毒且更稳定的非铅钙钛矿的研究也越来越多,其中以铋系、锑系最为代表。又因Bi3+与
学位
中国正按照“规范、透明、开放、有活力、有韧性”的总目标深化资本市场改革,其中健全信息披露机制与完善投资者保护是重要的推进方向。在新发展阶段,资本市场有效发挥市场化资源配置功能和健全完善激励约束机制的使命与职责,离不开完善的信息机制和畅通的信息渠道。长期以来,我国资本市场参与者之间存在较为严重的信息不对称,导致一系列资源错配问题。管理层、大股东等内部人借助信息优势侵占公司利益的事件频频发生,进一步扭
学位
本文主要研究图的点染色和全染色问题,确切地说,是探究平面图的可松弛性和不含K5子式图的全染色。图G的k-全染色是指用k种颜色对V(G)∪E(G)中的每个元素染色使得任意两个有邻接或关联关系的元素染不同的颜色。而G的全色数χ"(G)则被定义为最小的正整数k使得G有一个k-全染色。Behzad和Vizing独立地提出了著名的全染色猜想:对任意最大度为Δ的图G,都有Δ+1≤χ"(G)≤ Δ+2。下界显然
学位
2007年至2009年的全球金融危机体现了世界金融体系的错综复杂性和巨大的系统性风险,也使得奈特不确定性再度引起了学者的关注。彭实戈院士于2006年所创立的非线性期望理论是处理金融中带有奈特不确定性问题的一个强有力的工具。与Kolmogorov所建立的以线性概率测度为基础的现代概率论公理体系不同,该理论是以非线性期望为出发点,系统建立起的一套全新理论体系,并且该新理论处处都直接对应着概率模型本身的
学位
宽带隙材料具有独特的物理化学性质,在功率电子器件、光学透镜、微波功率器件、机电耦合系统等领域具有广泛应用前景,是开发新一代国防军事、电子通讯、量子技术、医疗健康技术不可或缺的重要材料。宽禁带材料与传统的金属和窄带隙半导体材料(如:硅材料及大部分二维半导体材料)比较,其表面也往往缺乏足够的自由载流子,表现出很大程度的化学惰性,这给利用传统技术手段进行材料表面的加工、改性及结构制作带来了一定的困难,严
学位
MXene是一类性能优异,家族庞大的新型二维晶体材料,因其独特的二维层状结构,以及不同终端官能团展现出的可调谐的性质,引起研究者的广泛关注,在储能、传感、催化等领域具有良好的应用前景。随着研究的深入,MXene面临的问题便凸显出来。目前,MXene的主要合成方法为酸性含氟试剂刻蚀法,导致MXene表面含有大量的F终端基团,终端官能团比较单一,限制了性能的多样性;F终端MXene的稳定性差,极易被氧
学位
聚合算子(也称聚合函数)是用来模拟信息融合的数学模型.近几十年来,随着计算机科学的发展,信息聚合的研究已成为热门研究领域,也是人工智能领域的关键问题之一.目前,聚合算子理论已经广泛应用于模糊逻辑、近似推理、决策、模式识别、图像处理等领域.为了满足不同领域的应用需求,研究学者构造了许多种类型的聚合算子.按其行为、功能的不同,将聚合算子分为四类:合取型聚合算子(以三角模为代表)、析取型聚合算子(以三角
学位