论文部分内容阅读
近年来,随着可再生能源的大规模并网、电动汽车的日益增多以及空调负荷的不断攀升等多种因素的影响,电网运行环境变得更加复杂。需求侧资源作为可与电网进行双向互动的负荷,在降低峰谷差,缓解短时的电力供应紧张、平衡可再生能源波动等方面发挥着日益重要的作用,各地也在陆续开展需求响应业务。然而,在用户响应行为未知的情况下,如何制定合适的价格,成为电力服务商亟待解决的问题。针对用户响应行为未知情况下的需求响应定价方法开展研究,主要工作如下:
对需求响应定价的基础即实施机制进行了分析和阐述,建立了需求响应实施机制的三层架构,包含实施主体层、调度方式层和参与主体层。分析了各实施主体的组织形式和责任,对不同调度方式的特点进行了详细的介绍,阐述了不同参与主体的参与方式和响应的特点。
针对电价型需求响应的实时定价问题,建立了综合考虑电力服务商利润和用户净收益的定价模型,提出了一种基于弹性迁移和强化学习的实时定价方法。利用已有地区的弹性,通过强化学习算法进行预训练得到Q矩阵,将其作为待实施需求响应地区的初始特征值,以解决用户响应行为未知的问题。然后使用强化学习算法进行需求响应价格的实际探索。算例分析表明,利用弹性迁移可以明显加快强化学习进行探索的速度,解决了只用强化学习进行探索速度过慢的问题。
针对激励型需求响应的实时激励价格决策问题,基于最大化电力服务商利润的目标,提出了一种基于长短期记忆网络和强化学习的实时激励价格决策方法。利用长短期记忆网络学习用户历史响应行为和激励价格之间的关系,同时考虑了不同时段的激励价格组合对电力服务商利润的影响。利用学习到的网络对用户响应行为进行预测,进而可以预先获知用户的响应,达到虚拟探索的效果,解决了强化学习在实际系统中只能依靠延迟的奖励来探索的弊端。算例分析表明,对于用户响应行为未知地区的实时激励价格制定问题,所提方法可以达到一个较快的学习速度,提高电力服务商的利润。此外,由于考虑了一天内所有响应时段的总利润,可以避免短视优化的负效用。
对需求响应定价的基础即实施机制进行了分析和阐述,建立了需求响应实施机制的三层架构,包含实施主体层、调度方式层和参与主体层。分析了各实施主体的组织形式和责任,对不同调度方式的特点进行了详细的介绍,阐述了不同参与主体的参与方式和响应的特点。
针对电价型需求响应的实时定价问题,建立了综合考虑电力服务商利润和用户净收益的定价模型,提出了一种基于弹性迁移和强化学习的实时定价方法。利用已有地区的弹性,通过强化学习算法进行预训练得到Q矩阵,将其作为待实施需求响应地区的初始特征值,以解决用户响应行为未知的问题。然后使用强化学习算法进行需求响应价格的实际探索。算例分析表明,利用弹性迁移可以明显加快强化学习进行探索的速度,解决了只用强化学习进行探索速度过慢的问题。
针对激励型需求响应的实时激励价格决策问题,基于最大化电力服务商利润的目标,提出了一种基于长短期记忆网络和强化学习的实时激励价格决策方法。利用长短期记忆网络学习用户历史响应行为和激励价格之间的关系,同时考虑了不同时段的激励价格组合对电力服务商利润的影响。利用学习到的网络对用户响应行为进行预测,进而可以预先获知用户的响应,达到虚拟探索的效果,解决了强化学习在实际系统中只能依靠延迟的奖励来探索的弊端。算例分析表明,对于用户响应行为未知地区的实时激励价格制定问题,所提方法可以达到一个较快的学习速度,提高电力服务商的利润。此外,由于考虑了一天内所有响应时段的总利润,可以避免短视优化的负效用。