强化学习算法在电力市场中的应用

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:xiaotaowang33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电力市场的建立,发电公司的竞价问题日益引起人们的关注。在电力市场环境下,发电公司从传统的完成发电任务转变为厂家竞标发电负荷以获得最大的利润,其目的和行为发生了本质的变化。发电公司事先申报电力价格,辅助服务价格等信息,电力运营中心根据各发电公司申报的信息,本着“公平,公正,公开”的原则安排各发电公司的发电量。如何利用自己掌握的信息合理申报,以获得最大的利润,是发电公司报价决策所要解决的首要问题。分析各发电公司如何竞争以获取最大的利润,一个有效的工具就是博弈论。经典博弈是以完全理性为基本假定,但实际上,发电公司在申报价格的时候既不可能掌握市场的所有信息,也不可能把现实中的各个因素都考虑到。因此,基于有限理性的模型更符合实际,它允许决策者可以简化,误解,缺乏能力,算错,忘记,估计依赖于表面上无关的有关问题如何构成的细节事物。基于有限理性的博弈模型更注重解释人们如何学习,适应或者演化到均衡。本文把博弈参与人的有限理性思想应用于发电公司的报价策略学习中。发电公司在作出一个决策后,期望能获得一个利润,拿这个利润与实际利润做比较,来不断修正报价策略。由于信息的不完全性和参与人的有限理性,发电公司的期望利润水平带有较大的经验性和主观性,当诸多发电公司都采用期望利润来学习报价策略时,他们主观意愿的相互作用将对市场的宏观性态带来何种影响是有待研究的问题,而这正是本文探讨的主题。基于此本文提出了基于期望利润的强化学习方法,它更能体现有限理性的参与者向自身期望水平的逼近。文章对期望利润强化学习算法进行了实验模拟,随着模拟的进行,发电商不断修正策略,最终发电厂商的报价策略将收敛于其均衡位置,市场可能呈现多种均衡状态。
其他文献
盐单胞菌属(Halomonas)通过胞内积聚有机相容溶质(Compatible solutes)来抵抗胞外的高盐渗透压。为了探究相容溶质Ectoine合成代谢相关基因的结构特征和异源共表达的可能性,
1企业概况 西林钢铁集团是全国89户重点钢铁企业之一,是黑龙江省直属最大的钢铁联合企业。年生产能力为铁113万吨、钢150万吨、材120万吨以及年产50万吨焦碳的综合生产能力。
在经济全球化程度日益加深的今天,商品品牌作为企业经营活动中的强大力量渗透到了世界的各个角落。随着企业之间的竞争日益加剧,产品的同质化程度越来越高,品牌就成为了指导消费
本文为实现CTCS-3级列车控制车载设备人机界面(DMI)显示信息的自动识别功能,在完成静态图片处理算法研究之后,提出了一种结合OpenCV库函数完成视频显示及数据保存的方案,从而实现
文章探讨了采用改性剂对氢氧化铝的表面进行改性方法,通过检测改性结果,结果表明采用改性剂对氢氧化铝的表面进行改性这一方法是可行的,能有效提高氢氧化铝与有机高分子材料
文章阐述了绿色施工技术与传统施工技术之间的关系,分析了绿色施工技术在高层建筑中的重要性,说明了高层建筑中施工的主要问题,包括建筑资源严重消耗、施工管理体系不完善,探
火花,曾经与邮票、烟标并称世界上三大平面收藏。从原始社会的钻木取火、青铜器时代的阳燧取火、铁器时代的镰石取火到近代社会的火柴取火。火柴的发明,堪称社会文明发展史上的
首先介绍基于合成距离包络,时域合成和频域合成技术的三种合成距离高分辨线性调频步进信号的方法。在此基础上,对这三种方法在运算量和性能上进行比较,并分析了运动对它们的影响
本文阐述了电力行业碳排放管理面临的问题;提出了一种燃煤电厂碳排放在线监测和管理系统设计方案,包括碳排放计量,指标计算,碳排放预警,碳配额管理,数据统计及调度和考核方法
本文依据国务院常务会议最新部署完善的固定资产加速折旧政策,结合工作实际,就目前固定资产一次性计入当期成本费用的会计处理通过案例进行解析,以期为相关纳税人的会计实务