无界报酬相关论文
本文在矩最优准则下讨论具有可数状态空间和任意行动空间的Lippman型无界报酬折扣半马氏决策模型。对任意ε>0,证明了k阶矩ε-最优......
本文研究具有可数状态空间和任意行动空间的Lippman型无界报酬折扣半马氏决策模型(DSMDM)矩最优策略的结构.证明了:若策略π,σ是(......
本文讨论了报酬函数夫界,转移速率族一致有界,状态空间和行动集均可数的连续时间折扣马氏决策规划,文中引入了一为新的无界报酬函数,并......
本文研究折扣准则的状态部分可观察无界报酬马氏决策规划,得到了一些新的结果,并探讨了将它转换为具可列状态集的马氏决策规划的可能......
讨论了无界报酬非时齐扣马氏决策模型,且哲扣因子βt依赖于前一阶段所处的状态和采取的行动,从而推广了常数折扣因子的马氏决策模型,在......
文章讨论无界非时齐马氏决策规划(MDP)的矩最优问题,并考虑初始状态的影响,证明了寻求最优策略等价于寻求最优马氏策略;指出一个k......
论文讨论折扣因子依赖于(i,a)的非时齐马氏决策规划,提出了两组报酬无界的假设,证明了时齐正、负动态规划中的结论在这里都成立。......
本文对可数状态集、非空决策集、报酬无界的平均准则马氏决策过程,提出了一组新的条件,在此条件下存在(ε)最优平稳策略,且当最优......