基于联邦强化学习的电热综合能源系统能量管理策略

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户:da330136324
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电热综合能源系统的能量管理关系到园区的经济效益与多能互补能力,但面临新能源出力随机性和用户负荷不确定性的挑战。本文首先构建电热综合能源系统能量管理问题的数学模型,将各供能子系统赋能为智能体,基于DDPG算法建立综合考虑子系统实时用能负荷、分时电价及各设备出力的系统能量管理模型。其次,采用联邦学习技术,在训练过程中交互三个子系统的能量管理模型梯度参数对模型的训练效果进行协同优化,打破数据壁垒的同时保护各子系统数据隐私。最后,算例分析验证了本文所构建F-DDPG能量管理模型对园区系统经济效益的有效提升。
其他文献
数据驱动的机器学习算法在自动驾驶汽车感知、决策、规划等相关研究中广泛应用。然而,这样机器学习算法模型很大程度上依赖于大量带标注的训练数据,而大规模人工标注是一个复杂且成本高昂的工作。因此,基于仿真引擎模拟或实际数据增强的自动驾驶数据生成技术逐渐成为当下研究的热点。数据生成技术一方面可以自动生成带标注的数据用于算法的训练,另一方面可应用于测试和验证算法在不同驾驶场景中的能力。其中,为满足算法对自动驾
学位
互连电缆作为传输线的一种,是电子系统中各个功能模块之间最主要的能量和信号传输介质。在电子系统的传导发射(Conducted Emission,CE),辐射发射(Radiated Emission,RE),抗扰度和信号完整性(Signal Integrity,SI)等电磁兼容性(Electromagnetic Compatibility,EMC)问题中,电缆都起着至关重要的作用。本文针对电子系统平台
学位
钙钛矿电池作为一种新兴的太阳能电池,具有制造成本低、轻质化、柔性等优点,而且在光电转化效率提升和降本方面的潜力都很大。不足之处是尺寸小和稳定性差。钙钛矿电池研发成果层出不穷,部分成果已获得商业支持,正在进行初步产业转化。美国处于钙钛矿电池技术领先地位,而且正在投入大量资金用于研发。从组件对比来看,钙钛矿电池比单晶硅电池拥有组件成本优势。假设钙钛矿组件稳定性能够满足使用要求,寿命25年,将其与成熟的
期刊
在穿过折射率不均匀的散射介质(如毛玻璃、油漆、生物组织等)时,入射光会偏离原有的传播方向发生散射,使得成像系统只能探测到无规则分布的散斑图案,因此,散射介质通常被认为是成像的阻碍。近年来,研究人员提出了一系列能够利用散射光进行成像的方法,简称为散斑成像技术,其中,测量传输矩阵和波前整形优化具有原理直观且易于与其它方法融合使用的特点,已经被成功运用于显微成像、多模光纤内窥镜和光声成像等领域。然而,在
学位
有源电子扫描的相控阵天线具有波束扫描灵活,波束切换速度快和波束指向精度高等优点,被广泛应用于现代无线通信和雷达系统中。通信链路速率提高、雷达系统分辨率提高和电子系统多波形、多功能的发展趋势,对相控阵天线提出了宽频带、宽扫描角的迫切需求。另一方面,阵面上天线单元之间的互耦,会导致天线在波束扫描的过程中出现扫描盲点,继而影响天线的带宽和扫描角度。本文以提升二维相控阵天线的工作带宽和波束扫描能力为研究目
学位
高光谱遥感集合光谱和成像技术实现光谱数据和空间图像的同步获取,成为遥感技术的重大突破。高光谱图像由成像光谱仪以连续窄波段对目标场景同步采样生成,具有“图谱合一”的结构特性,能满足对目标物体成分组成和形貌特征的探测需求,在分类识别方面具有突出优势,因而被广泛应用于精准农业、地质勘测、环境监测和生物医学等领域。伴随着成像技术的不断发展,高光谱图像的光谱分辨率也越来越高,在提供高质量光谱信息的同时也对高
学位
卫星遥感图像记录了几十年来地球表面的各类信息及其变化,这些丰富的遥感图像已经被广泛应用于环境监测、城市规划、海洋遥感以及矿物勘探等重要领域。如何高效且准确地对遥感图像进行分析与理解,是遥感图像智能分析处理的关键。遥感图像处理技术发展的初期,研究者主要以基于像元的方式处理遥感图像数据,随着遥感技术的发展,卫星遥感图像的空间和光谱分辨率不断提高,基于像元的处理方法无法充分利用遥感图像中丰富的空间与光谱
学位
作为场景理解的关键性技术,图像语义分割一直是计算机视觉领域一个非常活跃的研究方向,它在自动驾驶、目标识别、人机交互、步态识别以及视频监控等方面有着广泛的应用。随着深度学习的发展,基于全卷积网络的语义分割技术取得了巨大的成功。然而,训练深层神经网络往往需要大规模带标注的训练数据,为语义分割任务获取像素级精确标注更是格外费时费力。因此,近年来,越来越多的研究者将注意力转向研究如何摆脱大规模像素级标注,
学位
轨道交通线网和站点的植入,承担着优化交通和城市结构的职责。而在大量站点周边,步行圈层引导下的土地价值衰减,造成相应城市功能和空间价值的衰减,导致相邻的多个站点难以整合联动。因此,如何充分发挥轨道交通站点的触媒作用,形成“以点带线,以线成面”的城市结构,成为值得深入研究的话题。而多站联动机制的形成,需要减弱步行圈层引导下的土地价值在远近距离上的差异度,由此在较远距离也能够进行较高价值的功能空间适配:
学位
呼叫中心是指通过电话等通讯媒介,为顾客提供业务咨询、信息查询、售后支持、交易处理等综合性服务的组织实体。据产业研究显示,近几年我国从事呼叫服务业务的呼叫中心企业越来越多,行业规模扩展迅速,从业坐席人数已超两百万。作为劳动密集型行业,制定科学合理的坐席人员排班方案是企业人力计划管理的重要技术手段。而实际坐席排班往往是高度企业场景依赖的,需要考虑各种不同的用工因素,其本质上是非常复杂的组合优化决策问题
学位