论文部分内容阅读
在Markov性能势基础上,研究了一类转移速率不确定但受紧集约束的遍历连续时间Markov控制过程(CTMCP)的鲁棒控制问题.根据系统的遍历性,平均代价Poisson方程的解可被看作是性能势的一种定义.在平均代价准则下,优化控制的目标是选择一个平稳策略使得系统在参数最坏取值下能获得最小无穷水平平均代价,据此论文给出了求解最优鲁棒控制策略的策略迭代(PI)算法,并详细讨论了算法的收敛性.