【摘 要】
:
近年来,深度强化学习已应用于众多电力系统控制问题中,并取得了很好的效果,但深度强化学习通常被认为是一个黑盒系统,在一些关键决策场景中难以被信任.因此,文章提出一种基于加权倾斜决策树的深度强化学习策略提取框架,首先,基于电力系统强化学习(Reinforcement Learning for Grid Control,RLGC)开源平台完成深度强化学习智能体的训练,并生成数据;然后,基于加权倾斜决策树进行策略提取;最后,在IEEE 39节点系统上中基于低压减载场景验证所提算法的有效性与先进性.
【机 构】
:
武汉大学 电气与自动化学院,湖北 武汉 430072;武汉大学 电子信息学院,湖北 武汉 430072
论文部分内容阅读
近年来,深度强化学习已应用于众多电力系统控制问题中,并取得了很好的效果,但深度强化学习通常被认为是一个黑盒系统,在一些关键决策场景中难以被信任.因此,文章提出一种基于加权倾斜决策树的深度强化学习策略提取框架,首先,基于电力系统强化学习(Reinforcement Learning for Grid Control,RLGC)开源平台完成深度强化学习智能体的训练,并生成数据;然后,基于加权倾斜决策树进行策略提取;最后,在IEEE 39节点系统上中基于低压减载场景验证所提算法的有效性与先进性.
其他文献
针对能源互联场景下电力通信网络和电力业务面临的安全风险,文章分析了电力量子密钥应用需求,设计了星地一体电力量子保密通信网络架构,研究了星地量子密钥广域分发、可信中继、统一管控和灵活应用等关键技术,并在北京和福建之间构建了星地量子保密通信示范网络,开展了广域应急指挥视频会商业务接入和现场测试,验证了星地一体电力量子保密通信技术电力系统的适应性,为能源互联网安全的提升提供了有益参考.
为研究三穗特色黄皮蛋加工过程中凝胶形成及颜色变化机理,以黄皮蛋无铅腌制工艺为基础,测定并分析黄皮蛋加工过程中蛋清游离碱度、微观结构、蛋白质二级结构及分子间作用力、质构特性、色差、还原糖含量、游离氨基酸的动态变化情况.结果表明,腌制过程中(0~18d),蛋清游离碱度不断升高,离子键作用力先升高后降低,氢键作用力、疏水作用力、二硫键作用力则逐渐增加;蛋白从粗毛孔无序状态变为有序的三维网状纤维结构;在第12天时,凝胶质构特性各指标总体最高,β-折叠和β-转角为主要结构.腌制12~18 d,高碱度导致凝胶结构被破
目的 探讨心理护理干预减轻心绞痛患者情绪。方法 纳入锦州市第二医院2018年1月至2019年12月的80例心绞痛患者,结合护理方式分组,分别是普通干预组和心理干预组,该组采取常规护理联合心理护理干预。比较生活质量评分以及不良情绪积分、疾病护理获得的总有效率、护理认可程度、心绞痛发作次数。结果 心理干预组护理后生活质量评分、高于普通干预组,不良情绪积分低于普通干预组,疾病护理获得的总有效率、护理认可程度高于普通干预组,心绞痛发作次数低于普通干预组,差异有统计学意义(P<0.05)。结论 心绞痛患者采用综合护
为探明非浓缩还原(not from concentrate,NFC)梨汁品质指标间的相互关系、构建NFC梨汁综合评价体系,以32个品种梨果实为材料,利用描述性统计、相关性分析、因子分析、回归分析对其鲜榨汁的12个品质指标进行统计分析,采用K-means聚类分析和判别分析法建立NFC梨汁品质判别函数.结果表明,NFC梨汁品质指标间离散程度差异很大,变异系数在5.46%~105.73%之间,其中,类黄酮变异系数最大,达到105.73%;而亮度(L值)变异系数最小,为5.46%.转化后的数据经因子分析共提取出4
目的 分析心理护理在高龄食管癌手术患者围手术期的应用效果。方法 研究对象为2018年5月至2019年5月本院收治的90例高龄食管癌手术患者,通过数字表法均分为参照组45例和研究组45例。参照组行常规护理,研究组另给予心理护理,比较两组心理状态及并发症发生情况。结果 研究组SAS评分低于参照组(P=0.000),研究组SDS评分低于参照组(P=0.000);研究组并发症发生率4.44%低于参照组20.00%(P=0.024)。结论 在高龄食管癌手术患者围手术期应用心理护理能改善患者心理状态,提升安全性,具有
虚假数据注入攻击是针对智能电网运行变量的攻击,通过篡改量测值对智能电网造成威胁.文章提出一种基于差分自回归平均移动模型的智能电网虚假数据注入攻击检测方法.首先,利用历史数据和差分自回归平均移动模型对智能电网的运行变量进行短期预测,得到该时刻智能电网可能的状态变量值;然后,观察量测值与相邻节点预测的状态变量值之间的负荷偏差,判断该节点是否受到攻击;最后,在IEEE 118标准电力系统上进行测试,测试结果证明所提方法的有效性.
为提升新一代电网调度控制系统数据访问能力,支撑大数据量高并发访问,文章提出了主从哨兵集群的分布式高速数据缓存功能组件架构.实现该组件的关键技术包括基于改进一致性哈希算法解决分布式环境下业务数据存储的均衡性问题,以渐进式哈希机制提高存储时映射表的缩放效率,基于多副本高速缓存冗余架构保证数据的高可靠性,以及通过缓存数据的自动更新策略保证过期缓存的更新问题.最后在试验验证环境中验证了高速缓存组件的并发处理性能.
云计算等新技术在电力企业的大规模应用使传统电力安全分区模式难以有效支撑现有业务,文章基于TCP提出了一种简化的跨安全区交互协议,屏蔽了设备底层的文件传输细节,统一生产控制大区与管理信息大区之间交互接口,满足请求/应答、订阅/发布传输模式.利用多线程技术开展面向电力隔离装置的多通道数据传输,建立了跨区优先级控制与数据确认机制,实现了高可靠的跨安全区传输,最后给出实验验证过程及结果,有助于提升电力安全分区之间的信息共享能力.
由于电网拓扑关系复杂,当电网发生故障时,电网调度员难以实时诊断故障点,进而及时处置故障.基于此,文章提出一种基于电网多元信息知识图谱的故障诊断研究及应用的方法,运用BiLSTM-CRF模型对所涉及的领域知识进行命名实体识别,抽取调规实体,并利用知识图谱技术,将厂站设备的属性及拓扑关系、电网历史故障预案信息、省地调度规程进行知识抽取、表示及推理,实现电网领域知识图谱的构建与应用.
利用神经网络可以有效提取信号非线性特征的特性,文章提出了一种基于生成式对抗网络(Generative Adversarial Networks,GAN)的噪声建模方法.该方法通过对实测噪声样本进行学习,得到噪声的统计特性.首先通过现场可编程门阵列(Field Programmable Gate Array,FPGA)采集测得实际的电力线噪声样本集,并对其进行归一化处理作为神经网络的输入.其次通过GAN网络的不断训练来学习噪声特征.最后将实测噪声数据与通过GAN模型生成的数据进行各阶统计特性对比分析,验证了