连续时间Markov决策过程的方差优化问题

来源 :暨南大学 | 被引量 : 0次 | 上传用户：qdragon

【摘要】

：

本文考虑连续时间Markov决策过程平均报酬的方差优化问题.假设状态空间是可数的,行动空间是Borel可测空间.本文的主要目的是在确定性平稳策略类里寻找方差最小的策略.有别于传统的Markov决策过程,该方差准则中的费用函数将受未来行动的影响.为此,我们通过引入“伪方差”,将初始的方差优化问题转化为“伪方差”优化问题.进一步,通过给出“伪方差”优化问题的策略迭代算法,导出原方差优化问题的最优策略,

【作者】

：

付亚青

【出处】

：

暨南大学

【发表日期】

：

2021年03期

【关键词】

：

连续时间Markov决策过程平均报酬方差最优方差最优策略策略迭代算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

战略差异度、内部控制质量与盈余管理

当前我国经济正处于增速换档、结构调整、动能转换的转型阶段,为了能够应对经济转型的机遇与挑战,在日益激烈的市场竞争中保持领先地位,部分企业就会选择制定偏离行业平均水平的战略,即形成战略差异度。近些年来资本市场上频繁发生的财务违规事件将盈余管理推上研究的热潮,盈余管理一直以来被学术界和实务界所关注。战略差异度会导致企业的经营风险和信息风险加剧,从而为企业管理层进行盈余管理提供了机会和操纵空间。基于此,

学位

战略差异度盈余管理内部控制质量

必须深入开展“三讲”教育

在县级以上党政领导班子和领导干部中，用整风精神开展以“讲学习、讲政治、讲正气”为主要内容的党性党风教育，是贯彻党的十五大精神和中央的部署，深入学习邓小平理论，加强领导班

期刊

领导干部队伍深入开展邓小平理论建设有中国特色社会主义思想政治建设班子建设思想政治素质队伍素质党的领导水平和执政水平基本理论

硼氟联合作用对大鼠切牙釉蛋白表达的影响

目的通过观察过量氟、硼以及氟硼联合作用对大鼠切牙釉蛋白表达的影响,初步探讨硼在预防氟斑牙中的作用。方法选择32只Wistar大鼠,随机分为4组。Ⅰ组常规饮用蒸馏水;Ⅱ组饮用

期刊

硼氟大鼠切牙釉蛋白boron fluoride rat incisor enamelin

粪肠球菌对多形核白细胞释放基质金属蛋白酶-8及凋亡影响的实验研究

目的体外研究粪肠球菌对多形核白细胞（PMNs）释放基质金属蛋白酶-8（MMP-8）及凋亡的影响。方法提取PMNs，以加入粪肠球菌悬浮液的PMNs作为实验组；加入乙酸肉豆蔻佛波醇的PMNs为阳性对

期刊

粪肠球菌多形核白细胞基质金属蛋白酶-8细胞凋亡Enterococcus faecalis polymorphonuclear leukocytes ma

新型含杂环姜黄素衍生物的合成及生物活性

为创制具有较高生物活性的绿色农药,以姜黄素为先导,采用活性基团拼接原理,设计合成了一系列未见报道的1,4-戊二烯-3-酮肟酯类化合物,其结构红外光谱（IR）、核磁共振氢谱（1H NMR）

会议

14-戊二烯-3-酮肟酯抑菌活性抗病毒活性

高职教育中的工业设计结构探讨

本文从工业设计的开办目的入手,论述了高职教育办工业设计的优势、高职教育中知识板块设置、高职教育中的师资队伍和教学模式建设,对高职的工业设计成长进行了初步探索。

期刊

高职教育知识板块产品开发双师型higher vocational and technical education the block of knowle

基于特征距离的迁移学习算法研究

在传统的机器学习中,学习任务是在给定充分训练数据的基础上来学习一个分类模型,然而一些新出现的领域很难获得充分的训练样本。其次,传统的机器学习假设训练数据与测试数据

学位

迁移学习多源迁移学习样本特征距离

下颌切牙Empress2瓷贴面与全瓷冠牙预备体及全瓷修复复合体的抗折裂研究

目的比较下颌切牙Empress2瓷贴面和全瓷冠牙预备体及修复体粘接后复合体的抗折强度。方法选择人离体下颌切牙50颗，随机分为5组。A组为瓷贴面牙体预备组，B组为全瓷冠牙体预备组，C

期刊

下颌切牙可铸玻璃陶瓷瓷贴面全瓷冠mandibular incisor castable ceramic ceramic veneer all ceram

含锌碳磷灰石的溶胶凝胶法制备及性能表征

目的通过溶胶凝胶法制备含锌的碳磷灰石（Zn-CHA）涂层材料,并探讨锌离子取代反应对羟磷灰石物理化学性质的影响。方法实验制备了锌离子取代量和钙磷比不相同的两组样本,其中钙足

期刊

碳磷灰石锌离子涂层材料溶胶凝胶法carbonated hydroxyapatite zinc coating material sol-gel meth

所得税对资本结构影响相关研究文献综述

本文回顾了截止2010年末涉及所得税对资本结构影响的相关文献，包括理论文献和经验文献，最后简要引出“投资者层面税收对企业支付决策影响”这一论题的研究情况。

期刊

所得税资本结构文献综述

连续时间Markov决策过程的方差优化问题

与本文相关的学术论文