连续时间马尔可夫决策过程平均最优的新条件

来源 :中山大学 | 被引量 : 0次 | 上传用户:zenghui_yan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  连续时间马尔可夫决策过程在很多领域有着广泛的应用,其中,平均报酬(费用)准则是最常用的准则之一,因为它被广泛应用于电信与排队系统,生产过程等领域。因此,对连续时间平均准则的研究不仅有一定的理论价值,而且有一定的实际意义。本文在转移率和报酬(费用)率有界的情形下,给出了一种特殊的马尔可夫决策过程——受控生灭系统平均最优的新条件。我们利用生灭过程的遍历性理论来确定其指数遍历的条件,这些仅仅建立在模型中初始数据之上的条件,可以被我们用以证明最优平稳策略的存在性,而且我们还将实现其在排队系统中的应用。
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
随着经济社会不断发展,道路施工规模和投资不断扩大,软基处理成为道路施工面临的一个重要技术问题。如何采用科学合理应用软基加固技术,切实提高道路施工质量和安全水平,具有十分
高校大学生入党启蒙教育是高校党建工作中人才培养的重要端口,大学生是新时代青年党员的重要人才宝库,是实现中国梦的重要力量。大学生入党启蒙教育的过程和效果对学生党员发展
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
关于Duffin-Schaeffer猜想的研究由来已久,早在20世纪40年代,Duffin和Schaeffer就给出了一维情况下的Lebegue测度上的Duffin-Schaeffer猜想。从此,关于Duffin-Schaeffer猜想的一
哈密市东戈壁钼矿地质矿产勘查工作日前结束,已探明钼金属储量40万t,资源价值超过2 000亿元。哈密市东戈壁钼矿位于哈密市东南110 km处,是新疆境内迄今发现的最大钼矿,经查明
有人说,在中学里,学生很怕作文。其实,在小学,学生照样也怕作文。一到作文课,许多学生都很烦。个中的原因,除了学生自身的主观因素之外,老师对作文训练的命题很不科学也是不
Beresnevich及Velani建立的质量转移原理把Rk的子集的上极限勒贝格测度理论转换成豪斯多夫测度理论,本文推广这一结论到由矩形生成的上极限集。更精确的说,令{xn}n≥1是单位立
群签名是一种特殊的数字签名,在一个群签名方案中允许任何群成员代表群进行签名,验证者可以用群公钥去验证群签名的有效性但不能确定是哪一个群成员签的该签名:一旦发生纠纷,群管
  本文研究了可变形模板在字符识别中的应用问题。主要思路包括,提取了数字字符封闭的轮廓曲线坐标,对字符的两个一维坐标曲线信号进行分解,运用随机信号处理方法处理分解后的