论文部分内容阅读
跨区互联电网在优化资源配置、促进可再生能源大范围消纳等方面发挥的巨大效益使其建设规模不断扩大,运行形态日益复杂。传统的经验型、分析型电网调度技术已经无法适应跨区互联电网的发展需求,能够为跨区互联电网调度优化(dispatching optimization of inter-regional power grid,DOIRPG)问题提供有力决策支撑的精益化电网调度方法研究迫在眉睫。如何应对可再生能源大规模并网后给电网带来的随机不确定性,以及如何挖掘柔性负荷参与电网调度后给电网带来的潜在效益,成为跨区互联电网调度自动化技术研究中的重要课题。为此,本文主要做了以下工作:首先,对跨区互联电网架构及其子模块特性进行了研究。本文建立了包含风力发电机组、光伏发电机组、火力发电机组、负荷需求及直流联络线的跨区互联电网系统架构;基于概率分布函数建立了风力发电功率、光伏发电功率及负荷需求的随机不确定模型,并依据全时段控制策略及三阶段反弹模型对柔性负荷的中断量及反弹量进行了建模;基于电网实际运行约束建立了火力发电机组发电功率及直流联络线传输功率的约束模型。其次,建立了DOIRPG问题的离散马尔科夫决策过程(discrete Markov decision process,DTMDP)模型,给出了学习优化算法。本文给出了DOIRPG问题中连续型变量的离散化处理方法,围绕系统状态及状态空间、行动及行动集、转移概率及转移过程、回报函数及优化目标建立了DOIRPG问题的DTMDP模型;给出了求解DOIRPG问题的多Agent分层Q-learning算法理论及其具体步骤;分析了DOIRPG任务特征,提出了一种衡量DOIRPG任务之间相似性的相似性度量方法,并给出了迁移学习的知识迁移理论及算法的具体流程。最后,针对DOIRPG问题设计了具体的知识迁移方式并进行了实验仿真。本文针对DOIRPG问题设计了具体的单源知识迁移方式,通过仿真实验验证了单源迁移学习的有效性及所提相似性度量方法的合理性,分析了不同权重参数对算法寻优速度的影响;针对DOIRPG问题设计了多种不同的多源迁移方式,通过仿真实验验证了多源迁移学习的有效性,并且分析了不同迁移方式对算法寻优速度的影响。