策略迭代算法相关论文
系统的多状态缓慢退化过程会影响系统功能的实现,在采样不完全、采样成本高的条件下对缓慢退化系统的维修策略进行研究,是重要的学术......
微网(micro-grid)由分布式发电装置、储能装置、负荷及控制装置组成,既可并网运行,也可以孤岛运行。在并网运行时,与电网进行能量......
现实的自动化生产线中,有一类由传送带将工件送至配有缓冲库的加工站进行加工的生产系统,称之为传送带给料加工站(Conveyor-Servic......
铁路货车运输能力的快速扩充和货车维修策略由计划修向状态修的转变为货车的维修管理带来了巨大挑战。车轮作为铁路货车的关键零部......
本文考虑连续时间Markov决策过程平均报酬的方差优化问题.假设状态空间是可数的,行动空间是Borel可测空间.本文的主要目的是在确定......
为了在采样不完全、个体差异明显的条件下对缓慢退化系统的维修策略进行研究,针对具有个体差异的缓慢退化系统,选择线性混合效应模......
旅行售货员问题是一个NP-完备问题,至今没有多项式算法。本文利用MDP的方法,建立了随机TSP问题的平均目标模型,并给出了随机TSP问题的平均模型的策......
为了解决非线性系统中的最优控制问题,在性能势理论的基础上,提出了一种基于勒贝格采样的新的事件触发控制策略。首先,根据最优控......
针对二自由度飞行姿态模拟器的姿态稳定问题,依据强化学习中的策略迭代算法设计姿态稳定控制器。将策略迭代学习算法与多项式T-S模......