平均准则相关论文
本文分别针对离散时间折扣准则MOMDP模型、离散时间平均准则MOMDP以及连续时间折扣准则MOMDP模型的摄动问题给予讨论,并分为两......
根据连续时间马尔可夫决策过程的平均准则,给出了一种特殊的马尔可夫决策过程一受控排队系统平均最优以及约束最优的新条件.这个新条......
本篇博士论文对离散时间马氏决策过程(discrete-time Markov decision processes, 简记为DTMDP)的一系列问题做了进一步的研究. 这......