基于多步回溯Q学习的自动发电控制指令动态优化分配算法

来源 :控制理论与应用 | 被引量 : 0次 | 上传用户：YYXINLEI

【摘要】

：

单步Q学习在火电占优、机组时延较大的自动发电控制（AGC）功率指令动态优化分配中的应用表现出收敛速度慢等不足而影响最优策略的获取．具有多步预见能力的多步回溯Q学习（Q（λ））显式利

【作者】

：

余涛王宇名甄卫国叶文加刘前进

【机构】

：

华南理工大学电力学院,广东电网公司中山供电局

【出处】

：

控制理论与应用

【发表日期】

：

2011年1期

【关键词】

：

Q(λ)学习自动发电控制控制性能标准随机最优调节费用 Q（λ） learning automatic generation control CPS

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

单步Q学习在火电占优、机组时延较大的自动发电控制（AGC）功率指令动态优化分配中的应用表现出收敛速度慢等不足而影响最优策略的获取．具有多步预见能力的多步回溯Q学习（Q（λ））显式利用资格迹进行高效回溯操作，能够有效解决火电机组大时滞环节带来的延时回报问题，算法平均收敛时问较Q学习缩短50％以上．算法奖励函数引入调节费用一项，形成多目标动态最优控制．两区域模型及南方电网模型仿真研究分析显示，Q（λ）算法在随机、大负荷扰动的复杂系统环境中有效提高系统控制性能标准（CPS）控制品质和适应性，并且在保证CPS合格

其他文献

语文教师应多为教学营造美的氛围

期刊

语文教师语文教学课堂教学教学氛围教学手段审美

唯物史观与可持续发展观

以强调人与自然关系的和谐为理论构架的可持续发展观是对传统发展观念的扬弃，该理论与马克思主义唯物史观有着内在逻辑上的一致性。后者为其提供了本体论和认识论基础，而前者也

期刊

唯物史观可持续发展观Materialist Conception of History Sustainable Development Concept

论提高教师的思想政治素质是提高学生思想政治素质的关键——学习江泽民同志《关于教育问题的谈话》

教师在社会中处于十分重要的地位.教师在培养和造就社会人才方面起着特殊重要的作用.对学生实施全面素质教育就对素质教育的实施者提出了更高的要求.在部分教师中存在着不同

期刊

教师思想政治素质道德素质教师人格学生

从法律适用，谈我国宪法司法化

该文从最近最高人民法院的一个司法解释<关于以侵犯姓名的手段侵犯宪法保护公民受教育的基本权利是否应承担责任的批复>来探讨我国司法实践中一个非常敏感性的问题."宪法条款

期刊

法律适用宪法司法化中国法律规范

时延加权融合技术的无线传感器网络控制

本文研究了无线传感器网络控制系统的建模、稳定性与控制器设计问题.首先建立一个新的无线传感器网络控制系统模型,然后提出一种用于多个传感器数据融合的时延相关加权均值方

期刊

无线传感器网络马尔可夫链跳变线性系统均方稳定wireless sensor networks Markovian chains jump linea

寻找多智能体系统一致性的迭代学习方法（英文）

本文利用迭代学习的方法研究了带头结点的多智能体系统的一致性问题.文中分别对单积分多智能体系统和一般的线性多智能体系统提出了迭代学习型的一致性算法.该算法对每一个从

期刊

多智能体系统迭代学习一致性算法multi-agent systems iterative learning control consensus alg

具有有限连续丢包网络控制系统的最优线性估值器

本文研究了观测数据和控制输入数据传输具有有限连续丢包的线性离散随机系统的最优估计问题.利用两个满足Bernoulli分布的随机变量来分别描述从传感器到估值器和从控制器到执

期刊

有限连续丢包最优线性估值器射影理论稳态估值器网络控制系统finite consecutive packet dropout optimal line

读者反应与文化交流

本文对奈达的读者同等反应论进行反思,认为奈达提出的将目的语读者读译文的反应与原文读者读原文的反应作比较是不切实际的,因为文化差异的客观存在决定了同等反应是不可能的

期刊

文化交流读者反应“他者”全球一体化文化差异译文读者文化发展共同繁荣目的语奈达原文尊重the reader's equal res

“改革开放和谐率先富民强省”——山东县域改革30年高峰论坛述论

改革开放的30年，也是县域改革与发展艰辛探索、不断开拓、造就辉煌的30年；县域改革具有改革主体的自觉性、运行的目的性、内容的综合性、形式的多样性、方法的科学性等五大特征

期刊

县域高峰论坛改革开放县域发展县域经济城乡一体化Intra-county Summit Forum Reform and open Intra-

一种间歇过程的综合预测迭代学习控制方法（英文）

为了提高迭代学习控制方法在间歇过程轨迹跟踪问题中的收敛速度,本文将批次间的比例型迭代学习控制与批次内的模型预测控制相结合,提出了一种综合应用方法.首先根据间歇过程

期刊

迭代学习控制模型预测控制综合控制间歇过程iterative learning control model predictive control in

基于多步回溯Q学习的自动发电控制指令动态优化分配算法

与本文相关的学术论文