连续时间Markov决策过程的方差优化问题

来源 :暨南大学 | 被引量 : 0次 | 上传用户:qdragon
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文考虑连续时间Markov决策过程平均报酬的方差优化问题.假设状态空间是可数的,行动空间是Borel可测空间.本文的主要目的是在确定性平稳策略类里寻找方差最小的策略.有别于传统的Markov决策过程,该方差准则中的费用函数将受未来行动的影响.为此,我们通过引入“伪方差”,将初始的方差优化问题转化为“伪方差”优化问题.进一步,通过给出“伪方差”优化问题的策略迭代算法,导出原方差优化问题的最优策略,接着通过定义方差差分公式,给出了方差最优策略的一个必要条件.最后,我们将证明其在排队系统和受灾难控制的生存死亡过程中的应用。
其他文献
当前我国经济正处于增速换档、结构调整、动能转换的转型阶段,为了能够应对经济转型的机遇与挑战,在日益激烈的市场竞争中保持领先地位,部分企业就会选择制定偏离行业平均水平的战略,即形成战略差异度。近些年来资本市场上频繁发生的财务违规事件将盈余管理推上研究的热潮,盈余管理一直以来被学术界和实务界所关注。战略差异度会导致企业的经营风险和信息风险加剧,从而为企业管理层进行盈余管理提供了机会和操纵空间。基于此,
在县级以上党政领导班子和领导干部中,用整风精神开展以“讲学习、讲政治、讲正气”为主要内容的党性党风教育,是贯彻党的十五大精神和中央的部署,深入学习邓小平理论,加强领导班
目的通过观察过量氟、硼以及氟硼联合作用对大鼠切牙釉蛋白表达的影响,初步探讨硼在预防氟斑牙中的作用。方法选择32只Wistar大鼠,随机分为4组。Ⅰ组常规饮用蒸馏水;Ⅱ组饮用
目的体外研究粪肠球菌对多形核白细胞(PMNs)释放基质金属蛋白酶-8(MMP-8)及凋亡的影响。方法提取PMNs,以加入粪肠球菌悬浮液的PMNs作为实验组;加入乙酸肉豆蔻佛波醇的PMNs为阳性对
为创制具有较高生物活性的绿色农药,以姜黄素为先导,采用活性基团拼接原理,设计合成了一系列未见报道的1,4-戊二烯-3-酮肟酯类化合物,其结构红外光谱(IR)、核磁共振氢谱(1H NMR)
本文从工业设计的开办目的入手,论述了高职教育办工业设计的优势、高职教育中知识板块设置、高职教育中的师资队伍和教学模式建设,对高职的工业设计成长进行了初步探索。
在传统的机器学习中,学习任务是在给定充分训练数据的基础上来学习一个分类模型,然而一些新出现的领域很难获得充分的训练样本。其次,传统的机器学习假设训练数据与测试数据
目的比较下颌切牙Empress2瓷贴面和全瓷冠牙预备体及修复体粘接后复合体的抗折强度。方法选择人离体下颌切牙50颗,随机分为5组。A组为瓷贴面牙体预备组,B组为全瓷冠牙体预备组,C
目的通过溶胶凝胶法制备含锌的碳磷灰石(Zn-CHA)涂层材料,并探讨锌离子取代反应对羟磷灰石物理化学性质的影响。方法实验制备了锌离子取代量和钙磷比不相同的两组样本,其中钙足
本文回顾了截止2010年末涉及所得税对资本结构影响的相关文献,包括理论文献和经验文献,最后简要引出“投资者层面税收对企业支付决策影响”这一论题的研究情况。