基于强化学习算法的用户与售电商互动用电研究

来源 :华北电力大学(保定) | 被引量 : 0次 | 上传用户：qiansujiao

【摘要】

：

【作者】

：

谢添阔

【机构】

：

华北电力大学(保定) 华北电力大学

【出处】

：

华北电力大学(保定)

【发表日期】

：

2020年期

【关键词】

：

电力现货

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着电力现货市场的不断推进，电力供需双方的互动日益频繁，参与需求响应的主体越来越多。就需求响应发布者而言，除了传统情况下，电网公司发布需求响应外，售电商同样有发布需求响应的需求。由于售电商的决策通常会对电力用户的行为产生长期影响，因此有必要研究一种能使得售电商长期收益最大化的方法。本文采用了适合解决需求响应这种序贯决策问题的强化学习算法，并针对售电商与用户的需求响应中状态与动作空间过大导致维数灾以及用户实际场景与训练场景存在随机偏差的问题，改进了相应算法，并进行了仿真实验验证。具体研究内容及成果如下：
　　建立了用户与售电商两个不同主体多时间尺度的需求响应互动用电模型。针对我国现货市场特点，确定了售电商通过寻求最优补贴价格使得长期收益最大化，用户通过削减负荷使得当次需求响应收益最大化的目标。将售电商参与需求响应的收益函数分为节省的购电成本、减少的售电收益以及付给用户的响应补偿费用。将用户参与需求响应的收益函数分为付出的响应成本、减少的购电成本和获得的响应补贴。考虑了售电商发布的历史补贴价格对用户舒适成本感知的影响，建立了用户舒适成本函数的前后联系，构建出售电商与用户在互动用电中的动态优化收益函数。
　　使用基于神经网络的强化学习方法解决售电商与用户在需求响应互动用电问题中的维数灾问题。研究了基于值函数的Q-学习强化学习方法，利用用户的需求响应收益函数确定其响应负荷，并将售电商当次需求响应的收益函数转化为Q-学习中的立即奖励函数。针对需求响应问题中状态与动作空间过大导致传统的Q-学习方法产生的维数灾问题，提出使用BP神经网络逼近Q-学习中值函数的方案。仿真验证了使用基于神经网络的强化学习算法能够有效避免维数灾问题，并且可以得到使售电商长期收益最大的策略。
　　使用多场景强化学习方法解决售电商与用户在需求响应互动用电问题中的场景差异问题。在需求响应过程中，由于实际场景与强化学习的训练场景存在随机偏差，本文在基于神经网络的强化学习方法的基础上，选择使用蒙特卡罗方法进行场景生成，然后分别对每个场景进行强化学习训练，同时提出了将实际场景与训练场景进行对比的方法，以选出与实际场景最相近的训练场景进行策略输出。仿真结果表明，在用户负荷出现较大波动时，使用多场景强化学习方法可以有效输出策略，使售电商在需求响应中能获得更高的长期收益。

其他文献

基于电气量的变压器绕组变形在线监测研究

变压器作为最重要的电力设备之一，其安全稳定运行对电力系统至关重要。变压器绕组变形在所有类型的变压器故障中占相当大的比例，如不能及时发现，可能会损坏变压器固体绝缘，造成绝缘击穿事故。　　本文利用Ansys软件建立了变压器二维有限元模型，计算绕组电容、电感参数；利用Simiulink软件建立了三相变压器分布式参数等值电路模型，模拟实际电网运行状态。仿真结果表明本文搭建的仿真模型结构合理、精确度高，为后

学位

变压器

变电站继电保护设备缺陷关联性分析与二次回路故障诊断方法研究

变电站继电保护设备可靠工作保证了变电站的运行稳定性。随着智能站的发展，复杂的智能设备、网络化的光纤链路、标准化的通信模型给智能站运维人员带来了极大的挑战。目前智能站的多源异构数据统一管理和运用难以实现。针对海量的继电保护设备缺陷数据，检修运维人员缺乏有效的缺陷数据分析方法。另外，智能站继电保护二次回路故障诊断也较为困难。针对以上问题，本文以减少变电站继电保护设备缺陷，实现二次回路故障诊断为根本目的

学位

变电站

直流及新能源高渗透型电网惯性与稳定性评估研究

多回大容量直流异步外送、新能源规模化并网，使得区域电网呈现显著的低惯性特征，其网架结构蕴含了复杂的稳定特性。长期以来，在电网规划设计和运行中忽略了系统惯性的影响，且基于完整的同步电网条件对备用需求进行设置。对于直流和新能源高渗透的低惯性电网，一方面，风电、光伏等波动性电源加剧了运行方式的多样性；另一方面，多类型交直流故障使得故障分析数目大为增加。因此，当前迫切需要掌握新能源高渗透型电网的惯性特性，

学位

高渗透型电网

基于继电保护测试技术的智能变电站故障诊断技术研究

智能变电站继电保护装置的性能直接影响变电站的安全稳定运行，而继电保护装置性能的测试通常由专用的继电保护测试仪来完成。大量调试现场的反馈信息，特别是针对保护单体的调试反馈信息，表明使用现有的数字式继电保护测试仪来完成保护装置的单体调试往往需要消耗大量的精力以及时间，而且，利用现有的数字式继电保护测试仪无法完成对保护装置的通信一致性检查。　　为提高数字式继电保护测试仪的测试效率和测试效果，测试过程标准

学位

智能变电站

基于多能互补的交直流混联送端电网安全稳定特性研究

随着多项新能源和常规电源打捆联合外送的特高压直流工程建设，送端区域电网将形成多类型电源互补且交直流混联的新特点。新能源渗透率的大幅度提高，对交直流混联送端电网的安全稳定特性将产生较大影响。本文针对多能互补交直流混联送端电网，从暂态稳定性的角度，对大规模新能源并网方案、电源组织方案和新能源极限消纳能力等三个问题进行了重点研究。　　分析了规模化新能源采用不同拓扑结构和并网点方案下送端电网的特性。提出了

学位

交直流混联电网

火电-储能联合调峰的调控技术研究

我国东北地区源荷供需矛盾突出，新能源装机容量的持续增长和负荷增速的不断下降加剧了电网的供需差异，调峰问题愈加严重。东北地区供热期热电机组以热定电方式运行，电网低谷调峰极其困难。为解决电网调峰难问题、提高清洁能源利用效率，国家发布多项政策开放调峰辅助服务市场，鼓励机组及其他可控负荷参与调峰。目前主流的调峰方案均存在环境及运行效率等方面的不足。利用储能技术的电能双向流动、能量时移及灵活调节的特点，能够

学位

电力系统

载波信号在中压电缆线路上耦合与衰减分析

随着国家电网公司“泛在电力物联网”概念的提出，标志着我国正向世界一流能源互联网迈进。“泛在电力物联网”的实现，需要先进的信息技术、通信技术和智能技术等各方资源提供充足有效的信息数据。电力线载波通信利用现成的电力网络作为通信信道，大大节省了建设信道的投资，具有天然的网络通道资源和应用的灵活便利性，作为光通信的补充和延伸，电力线载波通信是泛在电力物联网通信技术的重要选择之一。本文以地埋电缆为传输介质的

学位

电力线载波通信

基于SSSC的双馈风电场并网系统次同步振荡抑制方法研究

我国在建设大型风电基地的进程中，主流双馈风电场经固定串补通道外送功率时面临诱发次同步振荡(SSO)的风险问题。现有风电SSO解决方案主要包括升级、改造双馈风机(DFIG)控制策略和设计并联型FACTS抑制装置，鲜有文献报道串联型FACTS抑制装置。本文针对双馈风电场并网系统的SSO问题，研究基于H桥型静止同步串联补偿器(H-SSSC)的风电SSO抑制方法，主要研究工作如下：　　建立了双馈风电场-固

学位

风电并网

MMC型静止同步串联补偿器抑制风电次同步振荡研究

近年来风电装机容量不断提高，以双馈风机(Doubly-Fed Induction Generator, DFIG)为主的大型风电场逐渐增多，其经串补并网系统次同步振荡(Sub-synchronous oscillation, SSO)问题日益严重。串联型FACTS装置因其较好的灵活性、运行方式对其抑制效果影响小的优点，适合用作SSO的抑制。模块化多电平换流器(Modular Multilevel

学位

模块化多电平换流器

柔性直流输电系统参数稳定问题研究

目前我国经济社会处于高速发展时期，电力需求日益增长。直流输电系统在大容量、远距离输电领域获得了广泛的应用。随着半导体全控型器件的技术进步，柔性直流输电系统获得了长足的发展，在新能源接入，远距离输电，城市配电等领域受到越来越多的关注。柔性直流输电系统是一个多参数、高维度、强非线性的复杂系统。柔性直流输电工程的控制系统参数，需要根据系统条件和工程经验进行调整。但一些系统难以通过参数调试来获得系统的稳定

学位

柔性直流输电

基于强化学习算法的用户与售电商互动用电研究

与本文相关的学术论文