递归报酬函数相关论文
研究一类具有无界递归报酬函数的非时齐马尔科夫决策模型,建立了模型的最优方程,证明了ε—最优马氏策略的存在性,给出了一个策略......
研究一类具有无界递归向量值报酬函数的非齐马尔科夫决策规划,给出了模型的向量最优方程,首次给出了模型的向量ε-最优策略的定义及其......