基于平均报酬模型全过程R(λ)学习的互联电网CPS最优控制

来源 :电力系统自动化 | 被引量 : 0次 | 上传用户:wooool123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种新颖的基于平均报酬模型的全过程R(λ)学习互联电力系统CPS最优控制方法。该方法与电网自动发电控制(AGC)追求较高的考核时间段内的10min平均控制性能标准(CPS)指标合格率的目标相吻合,且所提出的基于平均报酬模型的R(λ)学习算法与基于折扣报酬模型的Q(λ)学习算法相比,在线学习收敛速度更快,可获得更佳的CPS指标。此外,所提出的改进的R(λ)控制器具有全过程在线学习的特点,其预学习过程被一种新型的在线"模仿学习"所代替,克服了以往强化学习控制需要另外搭建仿真模型来进行预学习收敛的严重缺陷,提高了R(λ)控制器的学习效率及其在实际电力系统中的应用性。
其他文献
近年来,我国工程项目的建设数量不断增多,企业之间的竞争日益激烈,因此各企业都纷纷采用降低成本的方式来获得生存发展,注重工程的造价控制。但是他们所关注的造价并不包括设
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
采用传统生产聚氯化铝的主要工艺和原料,制备出不同聚氯化铝系列样品,并应用Al-Ferron逐时络合比色法和混凝沉淀法进行了铝水解聚合形态和混凝沉淀效果的研究。研究结论中对
为进一步加快内蒙古自治区特色小镇规划建设,充分发挥小城镇在城乡建设和经济社会发展中的作用,推动新型城镇化和城乡一体化发展,内蒙古自治区人民政府办公厅近日印发《关于特色
摘要:在幼儿阶段的体育锻炼中,跳绳活动是一个重要的体育项目,培养幼儿体育兴趣是教师在幼儿体育教学过程中的一个重要目标。笔者在本文将结合跳绳活动的各种动作,对教师的教学方式和指导策略进行深入的分析,希望能够为幼儿跳绳活动提供有利的教学建议。  关键词:大班幼儿;跳绳活动;指导策略  一、 跳绳活动的基本优势和现状  跳绳活动能够将游戏与锻炼良好的结合,使幼儿的身体协调性得到有效的提高,而且跳绳活动的
基本案情$$被告人阿某从2009年至2016年在皮山农场教育中心担任主任一职,任职期间他多次以教育中心的名义向上级领导申请购买公用车辆,但都未获得批准。2016年6月25日,阿某指
报纸
国内外实践经验证明,社区管理服务无法单纯依靠投入大量的人力和物力来完善,信息化的控制和管理方法是当前社区智慧管理非常重要的手段.为此,提出了基于SOA架构与IOCP控管机
<正>当下,今年的高校招生录取工作正在酷暑之中紧锣密鼓地进行着,人们密切关注着各高校的投档线和录取控制线;今年也是由沪浙两地率先尝试的高考新政实施元年,尽管各高中学校
如果将巡视工作比作看病的过程,巡视组发现问题就是对被巡视党组织进行“健康体检”;省委巡视工作领导小组、省委“五人小组”会议、省委常委会议先后听取巡视情况汇报,就是
目的探讨人文关怀护理干预在人工流产患者中的应用效果。方法随机将2015年1月至2016年6月在本院行人工流产的160例患者分到观察组(n=80例)和对照组(n=80例),观察组研究对象施