最优平稳策略相关论文
本文以Markov性能势为基础,讨论G/M/1型排队系统的稳态性能灵敏度分析与优化问题。文中给出了系统极限分布与嵌入Markov链的稳......
本文基于离散和连续Markov过程的性能势理论,研究了一类半Markov过程(SMP)的灵敏度分析和平均代价准则下性能优化问题.将半Markov......
本文主要是研究离散时间马尔可夫决策过程在优化排队系统的应用.全文主要内容由理论基础和实际应用两部分组成.首先,在理论部分我们介......
连续时间马尔可夫决策过程在很多领域有着广泛的应用,其中,平均报酬(费用)准则是最常用的准则之一,因为它被广泛应用于电信与排队......
本文主要讨论了无界报酬向量模型的平稳策略问题,给出了改进平稳策略的方法,建立起向量模型的最优方程,获得平稳策略为强最优策略的充......
讨论一类半Markov控制过程(SMCP)的折扣代价性能优化问题.通过引入一个矩阵,该矩阵可作为一个Markov过程的无穷小矩阵, 对一个SMCP......
通过嵌入Markov链的方法,讨论了受控M/G/1排队系统,在无限水平平均代价准则下的最优平稳策略问题。定义了平均Poisson方程,导出了......
研究了一类离散时间Markov控制过程平均代价性能最优控制决策问题.应用Markov性能势的基本性质,在很一般性的假设条件下,直接导出......
首先分别在折扣代价与平均代价性能准则下,讨论了一类半Markov决策问题.基于性能势方法,导出了由最优平稳策略所满足的最优性方程.然后......
研究了半马氏MDP平均模型,提出了新的较弱的假设条件,证明了半马氏MDP平均模型最优方程解的存在性,然后从最优方程出发,证明了存在ε(≥0)-最优平......
研究了一类具有可数状态空间的Markov控制过程在无限水平平均代价准则下的最优平稳策略问题.对此类过程,引入了折扣Poisson方程,运......
本篇博士论文对离散时间马氏决策过程(discrete-time Markov decision processes, 简记为DTMDP)的一系列问题做了进一步的研究. 这......