无界费用相关论文
本篇硕士论文考虑的是马氏决策过程(Markov Decision Processes,简记为MDP)的折扣模型,分别在广义可测策略下对离散时间和连续时间MD......
本文考虑的是转移速率族任意且费用率函数可能无界的连续时间马尔可夫决策过程的折扣模型.放弃了传统的要求相应于每个策略的Q-过......