论文部分内容阅读
本文讨论非齐时折扣马氏决策规划最优策略的结构、性质和最优策略集,指出最优策略在一切可行路径均采用最佳措施(行动);若π(t+n)={π^(t+n),π1(t+n),…}为t+n时刻最优策略,n=0,1,2,…,则π^*(t){π0^(t),π0^(t+1),π0^(t+2),…}也是t时刻最优策略,构造了一个最优策略的等价类∏^*(t),∏^*(t)中策略的凸组合仍为最优。