论文部分内容阅读
以节点设备的劣化过程为基础,建立系统劣化模型,优化节点设备的维护可提高电力系统的可靠性,又可在保证可靠性的前提下降低电力系统运行的维护成本。针对设备劣化过程的随机性和电力系统中节点设备的拓扑架构,建立了离散时间Markov控制系统模型。应用基于马尔可夫决策过程理论的Q学习算法可有效实现控制策略的在线学习和动态优化决策。仿真试验验证了算法的有效性。