基于Q—学习的非线性控制

来源 :长沙电力学院学报(自然科学版) | 被引量 : 0次 | 上传用户:xzm191213
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
给出了一种新的激励学习(RL)方法,它能够有效地解决一个状态与动作空间为连续的非线性控制问题.在实际的应用中,离散的RL方法能把许多非线性控制问题分解成几个局部线性控制作业.提供了一种由简单的线性控制器和Q-学习构成的层次性RL算法.连续状态-动作空间被形象地分成为一些格子,并且每个格子都有它自己的局部线性控制器.状态空间的隔离是处理维数问题的一种相当简单的方法,但是经常会引起非Markov效果,而局部线性控制器能弥补这个缺陷.
其他文献
分析了脂肪族工艺在低温环境下净浆流动度变小的原因,并进行了系统的合成研究及生产验证,结果表明,提高反应浓度(部分反应水后置)是改善脂肪族工艺净浆流动度变小的有效措施,磺
为解决现行固定床稀土氟化炉内因温度分布不均而导致的氟化效果不佳问题,以新型立式氟化炉为研究对象,通过合理简化建立数学物理模型,采用CFD软件对模型进行计算分析,得到了
第十四届中国图书奖经评委会第一次全体会议确定138种图书为初评入选图书后,于11月上旬在《光明日报》、《中国新闻出版报》、《中国图书评论》杂志向社会公示。在广泛听取各方面意见的同时,评委分组审读了初评入选图书。随后,于12月7日评委会召开第二次全体会议,在充分讨论的基础上,
主持人:于先生和邹先生结缘,编辑出版了邹先生所著的<听老子讲道>、<伴孔子周游>、<〈道德经〉旁说>等文化系列,这个系列的选题是基于什么而策划的呢?
讨论网络计费系统的原理,比较了基于TELNET的计费方式和基于SNMP的计费方式的不同;论述了SNMP协议在网络计费系统中的实现.在此基础上设计了一个具体的计费系统模型,该计费系
灌区设施的好坏直接影响灌区效益和减灾能力的发挥。本文重点对U形渠道防渗效果,输水能力,抗冻胀性,施工工艺等优点进行了总结剖析,该项技术已作为一种节水的主要措施,在交口灌区
XPDL是工作流管理联盟推出的需由开发商共同遵守的一个统一的过程定义语言规范,由它定义的接口能在开发和运行环境之间提供形式上的分离.此外,用建模工具产生的过程定义可以
为了加强质量管理,提高商品竞争力,使商品顺利地进入国际市场,台湾也积极推行ISO9000系列标准。其主要做法介绍如下: 1、一步到位,直接转化为CNS标准 ISO 9000系列标准问世后
本文通过对凤翔县小型水库养鱼在鱼种投放、水质调节、鱼病防治、施肥等日常管理及经营方面的实践总结,就进一步提高小型水库鱼产量,取得更好的经济效益,提出了可行性的意见和对
在中国图书出版由品种数量向质量效益的转变过程中,精品生产始终具有重要的示范和带动作用.经中宣部研究批准,确定精神文明建设“五个一工程”一本好书、国家图书奖和中国图