马氏决策规划相关论文
类似[1-4],折扣向量值马氏决策规划(DVMDP)描述为:{S,(A(i), i ∈ S),q,r,Vβ, (1)其中S为可数状态集,A(i)是有限决策集,q(j|i,a)......
在状态空间和行动集均有限的条件下,[1-5]讨论了时间离散的、平稳的马氏决策规划的摄动模型.其中,[1,3,4]讨论了单摄动模型,[5]讨......
在大规模随机控制问题中,值函数逼近是一种克服维数灾的方法.考虑平均模型马氏决策规划(MDP)的状态软集结相对值迭代算法,在Span压......
舰艇搜索潜艇的过程可以近似地看作一种马尔可夫过程。研究了潜艇训练仿真系统中舰艇CGF(计算机生成兵力)搜索潜艇过程中的状态转移......
本文以三种径流随机描述方案为基础,研究了运用于三种径流随机过程有面临时段径流预报的水库随机优化的通用数学模型。通过黄龙滩......
<正> 以期望总报酬为准则的连续时间马氏决策规划,自R.A.Bellman(1957),特别是Miller研究以来,已有一些文献报道。这些文献,就我们......
<正> 本文综述了一般化马氏决策规射的研究现状,并讨论了存在的问题和进一步研究的方向.马氏决策规划(Markov Decision Programmin......