论文部分内容阅读
为适应不同实际工程系统在线优化的需要,本文在Markov性能势理论基础上,研究了Markov控制过程在参数化随机平稳策略作用下的仿真优化算法.不同于传统的基于计算的方法,文中的算法是根据观测实际系统的运行得到的单个样本轨道来迭代更新策略参数,以寻找最优(或次优)随机平稳策略.文中给出算法具有较强的适应能力,因为可根据实际系统的特征来选择合适的算法参数.