最优平稳策略相关论文
本文以Markov性能势为基础,讨论G/M/1型排队系统的稳态性能灵敏度分析与优化问题。文中给出了系统极限分布与嵌入Markov链的稳......
连续时间马尔可夫决策过程在很多领域有着广泛的应用,其中,平均报酬(费用)准则是最常用的准则之一,因为它被广泛应用于电信与排队......
讨论一类半Markov控制过程(SMCP)的折扣代价性能优化问题.通过引入一个矩阵,该矩阵可作为一个Markov过程的无穷小矩阵, 对一个SMCP......
通过嵌入Markov链的方法,讨论了受控M/G/1排队系统,在无限水平平均代价准则下的最优平稳策略问题。定义了平均Poisson方程,导出了......
研究了一类离散时间Markov控制过程平均代价性能最优控制决策问题.应用Markov性能势的基本性质,在很一般性的假设条件下,直接导出......
首先分别在折扣代价与平均代价性能准则下,讨论了一类半Markov决策问题.基于性能势方法,导出了由最优平稳策略所满足的最优性方程.然后......
研究了一类具有可数状态空间的Markov控制过程在无限水平平均代价准则下的最优平稳策略问题.对此类过程,引入了折扣Poisson方程,运......
本篇博士论文对离散时间马氏决策过程(discrete-time Markov decision processes, 简记为DTMDP)的一系列问题做了进一步的研究. 这......