电力系统的迁移强化学习优化算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户：star51324

【摘要】

：

在电力系统日常运行中,经常会遇到机组组合、无功优化等非线性规划问题。对于此类问题,常用的解决方法有经典数学方法和人工智能算法(artificial intelligence,AI)两大类。然

【作者】

：

张孝顺

【出处】

：

华南理工大学

【发表日期】

：

2017年期

【关键词】

：

迁移强化学习联系记忆均衡博弈一致性协同电力系统优化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在电力系统日常运行中,经常会遇到机组组合、无功优化等非线性规划问题。对于此类问题,常用的解决方法有经典数学方法和人工智能算法(artificial intelligence,AI)两大类。然而,由于系统较强的非线性、目标函数以及约束条件的不连续性、变量的离散性、以及存在多个局部最优解等问题,牛顿法、二次规划、内点法等经典优化方法在求解此类问题时往往效果不太理想,容易陷入局部最优。另一方面,人工蜂群算法、蚁群算法、粒子群、遗传算法等传统AI算法对具体数学模型的依赖程度较低,适合处理非线性和离散性优化问题,已被广泛应用于电力系统的各类优化问题。但是,上述AI算法均没有知识迁移的能力,每一次优化任务都是孤立的,在执行新的任务时必须重新初始化,不能较好地利用过去的优化信息,这就导致算法的寻优时间过长,难以满足大规模电力系统的快速优化需求。为此,本文提出了一类全新的迁移强化学习(transfer reinforcement learning,TRL)优化算法,用于大规模电力系统优化问题的快速求解。该算法利用集体智慧对问题环境进行高效的探索和利用,更新其集体共有的知识矩阵,并将历史源任务的最优知识矩阵存储起来,用于提炼新优化任务的最优知识矩阵,从而达到加快寻优速度的作用。对于大规模优化问题而言,首先将整个系统划分成若干个区域子系统,上层利用博弈论及一致性理论实现不同子系统之间的协调,底层利用TRL或一致性理论来快速获得子系统内部的最优解。总的来说,本文将不断逐步形成迁移强化学习的优化算法体系,用于解决电力系统的各类优化问题,如下:1)提出连续单任务迁移强化学习的集中式优化算法,采用联系记忆方式解决多维变量知识矩阵的维数灾难问题,利用蚁群及蜂群的集体智慧加快知识矩阵的更新速度,把前一个优化任务的最优知识矩阵保存下来,用于下一优化新任务的知识指导,可以有效避免盲目的随机搜索,提高寻优速度,最后利用电力系统经典无功优化问题进行性能验证。2)提出多任务线性迁移强化学习的分散式优化算法,利用二进制联系记忆解决连续控制变量的优化问题,并采用模仿学习加速知识初始形成阶段的探索与利用过程,并采用一致性理论实现智能体之间的合作交互协同学习,建立含多个历史任务的源任务库,根据新任务与源任务之间的相关性矩阵,实现高效的最优知识矩阵提炼,最后分别利用集中式以及分散式的自动发电控制(automatic generation control,AGC)功率动态分配优化模型对单智能体及多智能体的多任务线性迁移强化学习算法进行性能测试。3)提出多任务非线性迁移强化学习的分散式优化算法,在不同智能体之间分别引入纳什均衡和Stackelberg博弈协调机制,并采用极限学习机以及深度置信网络替代有限规模的源任务库,降低最优知识矩阵存储量,提高新任务最优知识矩阵的逼近精度,最后利用分散式最优碳能复合流问题以及电力系统供需互动实时调度问题进行仿真性能验证。

其他文献

同课异“构”·筑概念教学新视点——《倍数与最小公倍数》教学片段及反思

<正>数学概念是小学数学教学中重要的学习内容,它是现实世界中有关数量和空间形式及其本质属性在人的头脑中的反映.小学数学大纲指出:"使学生理解和掌握数与形的最基础的知识

期刊

最小公倍数概念教学《倍数与最小公倍数》教学片段新视点

Y对ADC12合金铸态组织与性能的影响

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

ADC12合金Y变质组织流动性能力学性能

枇杷果实苹果酸代谢关键基因筛选和分析

学位

枇杷苹果酸代谢转录组测序基因克隆基因表达

农杆菌介导优良玉米自交系Ⅱ型胚性愈伤组织遗传转化体系的建立

以玉米自交系8902、340、4112未成熟幼胚为材料,诱导、继代筛选出良好的Ⅱ型胚性愈伤组织,用农杆菌(EHA105和LBA4404)介导法转化其愈伤组织.利用本室构建的植物双元表达载体

期刊

玉米自交系愈伤组织农杆菌GUS基因

高职化工及制药类专业“双证”融合实践教学模式的探索与实践

为实现以技能培养为核心的高等职业教育人才培养目标,大力推行学历证书和职业资格证书双证书制度,深化高职教育教学改革,我们在高职化工及制药类专业进行了实践教学模式的探

期刊

技能培养双证书制度实践教学模式

“双述双评”促基层党建工作提升

为了强化党建述职评议考核工作实效,杜绝考核过程中可能出现的夸大成绩、避实就虚等问题,燕山大学党委创新设计基层党建工作'双述双评'机制,基层党组织书记既面向学

期刊

朋辈教育基层党建工作基层党组织

《建筑机械》2006年总目次

<正>~~

期刊

加快用网络信息技术推进社会治理

<正>党的十八大以来,习近平总书记就互联网发展发表的一系列重要讲话,为深入推进网络强国战略进一步指明了方向。习近平总书记要求加快用网络信息技术推进社会治理,对于我们

期刊

网络空间治理网络信息技术社会治理模式

中国古代趣味物理实验补遗

将分布在中国古籍中的一些趣味性浓的物理实验收集拢来予以介绍,扼要地分析了实验原理与方法,指出其在当今物理学中的应用,对了解中国古代物理实验产生、变化、发展的历程具

期刊

古代趣味物理实验方法

区域经理必须具备的十六种职业能力

区域经理必须具备执行能力、表达能力、沟通能力、适应能力、市场调查能力、观察能力、心理分析能力、策划能力、组织协调能力、预测防变能力、应变能力、独立解决问题能力、

期刊

区域经理职业能力

电力系统的迁移强化学习优化算法研究

与本文相关的学术论文