具有平均费用的非平稳Markov决策过程

来源 :经济数学 | 被引量 : 0次 | 上传用户:wangjuhui19
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了在一般状态空间具有平均费用的非平稳Markov决策过程,把在平稳情形用补充的折扣模型的最优方程来建立平均费用的最优方程的结果,推广到非平稳的情形.利用这个结果证明了最优策略的存在性.
其他文献
1987年诺贝尔(Nobel)经济学奖获得者Solow教授,建立了确定性的经济增长模型(1956年).它比较真实地描述了现实世界申的确定性的经济增长状况,然而对不确定性的现象,往往误差较大,甚至失效.本文把Solow模型扩展到
20世纪50年代以来,全球逐步出现了人口老龄化现象,特别是发达国家更是如此.紧接着,东南亚地区也随着经济的发展出现了人口老龄化.中国是一个最大的发展中国家,人口老龄化现象
在假定基本资产到期日的价格服从正态分布的条件下,本文讨论期权垂直价差的投资者获益的概率及其损益函数的数学期望,并导出某些有意义的结果.
以大鼠力竭性运动为模型,观察了牛磺酸对大鼠力竭运动时心肌线粒体脂质过氧化、超氧化物歧化酶、总Ca++浓度的影响.结果显示,牛磺酸可降低大鼠力竭运动后心肌线粒体脂质过氧
提出了闪锌矿在H2SO4-HNO3-O2中的氧化浸出与以四氯乙烯和磷酸二(2-乙基己基)酯组成的协同萃取3剂和表面活性剂的分离耦合操作模式.实验在自制的50 mL不锈钢反应釜中进行.优
<正> 图书馆形象,就是图书馆在读者心目中的印象。图书馆形象反映着读者对图书馆的认可程度,体现了图书馆的声誉和知名度。图书馆的良好形象,对读者有巨大的吸引力,从而使更
对膨胀床分离纳豆激酶过程的各个阶段进行了考察.在填充床上的探索性实验表明,吸附时最佳的pH为6.0,电导率应低于6.2 mS/cm.在膨胀床上样吸附阶段,考察了保持流速不变和保持
<正> 郓城县随官屯乡,18个行政村,24872人,有耕地47407亩。近几年来,该乡坚持以科技为先导,大力发展高产优质高效农业,作科技兴农、科技兴乡的大文章,促进了农村经济的快速发
世界上任何一个国家或任何一个企业,都不能在所有技术领域,甚至某一技术领域总是领先,都不能,也没有必要自行解决全部技术问题;对于自己需要的技术,除部分靠自己研
本文证明了两类价格经济的Pareto最优相关于价格系统均衡的存在性,以及Pareto最优与关于价格系统均衡的等价性。