基于深度强化学习的电力系统无功优化策略

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：yuming_wu

【摘要】

：

将人工智能应用于电力系统无功优化是电力系统智能化、人工智能技术实际应用和电力系统优化调度等多个热点研究方向的交叉,同时也为我国电力系统无功电压调控矛盾突出、电压

【作者】

：

杨丰毓

【出处】

：

哈尔滨工业大学

【发表日期】

：

2004年期

【关键词】

：

无功优化深度强化学习多智能体系统深度确定性策略梯度深度Q网络

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

将人工智能应用于电力系统无功优化是电力系统智能化、人工智能技术实际应用和电力系统优化调度等多个热点研究方向的交叉,同时也为我国电力系统无功电压调控矛盾突出、电压优化控制难度大这些亟待解决的问题提供了新的应对方法。电力系统无功优化可以通过调节无功控制设备来实现,如变压器抽头设置、发电机机端电压和无功补偿电容器组投切。许多传统的优化控制方法如灵敏度分析、二次规划、线性规划,这些方法要求控制变量连续且目标函数可微,从而这些方法易导致“维数灾”而无法应用于大系统。本文从强化学习的优化原理出发,研究了多种强化学习方法应用于电力系统无功优化的控制策略,旨在实现有效地协调电力系统无功控制设备动作,降低电力系统的有功损耗,实现电网安全及高效地运行。首先,在简述强化学习的基础数学原理的基础上,将强化学习中的动态马尔科夫过程应用在实际电力系统场景之中,实现了强化学习在电力系统中数学模型的建立。仿真结果表明,强化学习算法可以求解无功优化问题。针对传统强化学习采用价值函数迭代寻优的方法不适用于大系统无功控制的问题,本文利用深度神经网络来拟合价值函数,从而将深度强化学习应用在无功优化问题中。其次,基于深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG),提出了求解无功优化问题的集中式控制算法,并设计了智能体与电网控制设备的动作信息传送机制。为了加快神经网络的训练速度,在全连接层之间添加归一化层,优化了算法的网络结构。算例分析结果表明,所设计的算法相比其他智能算法具有更高的求解效率;并且有更好的优化效果。然后,基于深度Q学习网络(Deep Q-Learning Network,DQN)构建求解无功优化问题的分布式算法模型。DQN分布在各个无功控制设备智能体,用来计算设备产生的控制动作的动作价值。然后智能体利用贪心算法来选择控制动作并执行,从而使得智能体兼顾强化学习过程中所需要的探索和开发。智能体产生的离散动作可以直接应用在电力系统中,实现了深度强化学习智能体对电力系统“端对端”的控制。最后,研究了通过各控制设备所在母线之间的有功功率传送,来挖掘各智能体的奖励数据,通过一致性定理获得全局奖励数据,建立了多智能体深度Q网络(Multi-Agent Deep Q-Learning Network,MADQN)模型。算例分析结果表明,所设计的控制方法可以有效降低电力系统有功损耗,相较于集中式算法降低了庞大计算量所带来的时间成本。

其他文献

大剂量静脉滴注丙种球蛋白治疗新生儿败血症38例

新生儿发生败血症时,治疗困难,疗程长,病死率高.目前静注丙种球蛋白在儿科临床使用越来越广泛,在治疗新生儿重症感染方面,亦显示了肯定的疗效[1].为探讨静脉滴注丙种球蛋白在

期刊

静脉滴注丙种球蛋白治疗新生儿败血症

病案首页中基本信息存在的问题及控制对策

目的浅析病案首页基本信息质量提高的对策。方法抽查我院2010年8月～2011年5月2000份住院病案,对首页的基本信息存在问题进行统计分析。结果患者姓名、住院号、身份证、出生年

期刊

病案首页病案质量质量控制

氧氟沙星序贯治疗伤寒43例疗效观察

氧氟沙星是第三代喹诺酮类抗菌药物,具有抗菌谱广,抗菌作用强,组织内和细胞内药物浓度高、血清除半衰期长,患者耐受性好及不良反应少等特点,特别是对伤寒杆菌有强大的抗菌作

期刊

氧氟沙星序贯治疗伤寒疗效观察

加替沙星与左氧氟沙星治疗老年人社区获得性肺炎疗效分析

目的评价加替沙星与左氧氟沙星在治疗老年人社区获得性肺炎的疗效分析。方法将138例确诊为老年人社区获得性肺炎的患者随机分为治疗组与对照组,每组69例患者。治疗组予加替沙

期刊

社区获得性肺炎加替沙星左氧氟沙星疗效分析

景德镇市中学开展中长跑运动存在的问题及对策研究

中长跑是一项具有很强锻炼价值的体育项目，提高了人体的耐力素质，培养吃苦耐劳的精神。本文通过对景德镇市部分中学进行调查，对号德镇市中学开展中长跑运动存在的问题进行研究。

期刊

中长跑问题对策教学

口腔黏膜下纤维性变癌变危险因素的Logistic回归分析

目的探讨引起口腔黏膜下纤维性变癌变的危险因素,为自我预防和临床治疗提供理论依据。方法对病例组42例口腔黏膜下纤维性变癌变患者和对照组40例口腔黏膜下纤维性变未癌变

期刊

口腔黏膜下纤维性变癌变危险因素LOGISTIC回归分析malignant transformation of oral submucous fibrosi

退火温度对二氧化钛纳米管阵列亲水性的影响

采用电化学阳极氧化法,以含有0.25wt%NH4F和2mL H2O的乙二醇溶液作为电解液制备了TiO2纳米管阵列,然后通过不同温度退火比较其形貌、结构、元素组成和亲水性能。实验表明,600

期刊

二氧化钛纳米管阵列退火温度亲水性TiO2 nanotube array annealing temperature hydrophilicity

肌氨肽苷注射液治疗慢性心力衰竭97例疗效观察

肌氨肽苷注射液(心血通),其主要成分为降钙素基因相关肽(CGRP)、心房肽(ANP)、腺苷及多种氨基酸等,可扩张血管,增加心搏出量,改善微循环,降低血压,我科于1999年10月至2001年1

期刊

心力衰竭降钙素基因相关肽心血通肌氨肽苷注射液药物治疗

应用熔点曲线分析输血传播病毒的基因变异

目的研究输血传播病毒（TTV）的基因变异及其临床意义。方法采用巢式荧光实时多聚酶链式反应（PCR）扩增TTV DNA，收集TTV DNA阳性病例142例。其中献血员4例；非甲-非庚型慢性肝炎患者16

期刊

乙型肝炎输血传播病毒基因变异熔点曲线hepatitis B transfusion transmitted virus （TTV） gene varia

乙型肝炎病毒血清DNA定量检测的临床意义

目的探讨乙型肝炎病毒(HBV)感染者乙型肝炎病毒脱氧核糖核酸(HBV-DNA)定量检测的临床意义,以及与乙型肝炎血清学e系统(HBe)标志、丙氨酸转氨酶(ALT)和天冬氨酸转氨酶(AST)水

期刊

乙型肝炎病毒血清DNA定量检测脱氧核糖核酸聚合酶链反应hepatitis B virus DNApolymerase chain reaction

基于深度强化学习的电力系统无功优化策略

与本文相关的学术论文