带终端约束的部分信息随机最优控制问题的最大值原理及应用

来源 :山东大学 | 被引量 : 0次 | 上传用户:zhangjm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当Bismut[1]在研究随机最优控制问题时,第一次引入了线性倒向随机微分方程(BSDEs),随后,Pardoux and Peng[2]又引入了普通的非线性倒向随机微分方程。一个倒向随机微分方程耦合一个正向随机微分方程则构成了一个正倒向随机微分方程。这类方程其中的一种就是所谓的Hamiltonian系统,它是在研究随机最优控制问题的最大值原理时被引入的。众所周知,一般意义上对于一个正倒向随机微分方程来说,大多数情况下仅能得到部分信息,并且存在一些状态约束。因此,我们很自然地就会去研究一类带状态约束的部分信息随机最优控制问题。本文重点研究了一类控制系统由正倒向随机微分方程(FBSDE)描述的部分信息随机最优控制问题,其中的正向状态在终端时刻关于部分信息适应且被一个凸集约束。为了解决这类问题,我们把它转化为一个等价的倒向控制问题。通过运用Ekeland变分原理,我们得到了随机最优控制所满足的必要条件,即随机最大值原理。文章最后,我们利用滤波方程来研究了带状态约束的部分信息随机线性控制问题和递归效用最优控制问题。
其他文献
蛙人是海军作战体系中的特种作战力量。当前国际形势下,东南沿海岛屿争端仍然存在,海域环境比较复杂,蛙人在侦查、渗透等方面具有特殊优势。在新时代实战化训练要求下,海军院
在建立了弱再生资源的再生速度模型和谋利行为对资源的消耗模型的基础上,得出了在谋利行为下的弱再生公共资源的均衡曲线与均衡模型.利用此模型分析了个人非理性、个人理性的不
自2002年中国的黄金市场开放以来,中国的黄金需求大幅增长,于2013年首次成为全球第一大黄金消费国。中国作为具有黄金消费传统习俗的国家,未来的黄金消费需求规模值得深入探
<正>2019年8月26日,国务院正式批复我国山东、江苏、广西、河北、云南、黑龙江六省区设立自由贸易试验区。至此,我国自贸试验区数量增至18个。2013年9月,我国首个自贸试验区
<正> 战汗一証,多見于外感急性热病。因其突然发作,寒战頗剧,不但病者惶恐不安,缺乏經驗的医者亦往往无从措手;甚至誤認为发瘧,或疑治疗之不当、药石杂投,阻碍病机。茲不揣肤
期刊
<正>突破矩形上边线时买入是一种加码的法则,价格已走出横盘整理的趋势,发出了明显的转向讯号,风险相对较小。一、特征1、价格在某一区间内来回反复运行了1-3个月,连接该区间
<正>1引言泊松方程作为静电学、机械工程和理论物理中的一个重要偏微分方程,其高阶数值求解方法对理论和实际都很有帮助.在本文中将重点关注有限差分法在泊松方程求解上的应
运用润滑油原子发射光谱分析技术监控飞机航空发动机潜在故障已经取得了显著效果,但原子发射光谱分析存在局限性,无法测定大于15微米的异常磨损产生的大颗粒金属磨粒。本文论
直接频率合成器(DDS)是一种以数字取样技术为基础,以相位累加器为主体的频率合成器。DDS具有相位噪声低、频率分辨率高、频率转换时间短、工作频带宽、线路简洁等一系列独特的优
在基于工作过程系统化的课程开发、构建模块化课程体系的基础上,建设了与之相对应的实验实训基地,初步形成了模块化实验实训项目。根据课程开发,模块化课程中理论模块与模块化实