基于强化学习的大时延过程控制策略研究

来源 :控制工程 | 被引量 : 0次 | 上传用户:zhangruidao11
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
具有长时延的过程控制被公认为是较难的系统过程控制.模型预测控制(MPC)是一种适用于大时延过程的新的过程控制方法.相比于PID等传统的控制方法,MPC基于模型对未来状态的预测进行决策,能够兼顾及时反馈与长期规划.但MPC对于过程的预测步数依然是有限的.强化学习作为机器学习的重要部分,原则上能够预测策略在无限长时间内的收益.作者基于强化学习方法改进混凝剂添加过程中的控制算法,利用大量仿真数据训练模型,成功提升了该过程的控制效果.通过对该方法进行仿真模拟,并与传统的MPC方法进行对比,证明了使用强化学习改进过的控制方法在大时延过程控制中的总体表现优于传统MPC方法.
其他文献
粗糙集理论中一个重要的研究课题是残缺区间决策系统.针对现有决策系统存在分类精度和质量较低的问题,结合可能性相似度容差关系的优良特性,并运用粗糙集理论,设计出一种新的
治疗方法。西药选用氟呢酸或庆大霉素,常规剂量用药2~4天,同时给予中药以调和气血、健脾助运佐以清利湿热。处方:木香、在等、白术、赤白芍各9g,当归12g,淮山药15g,按榔6g,生大黄3g(后
为了研究钢轨在轨距角处打磨量对高速列车异常低频晃动的影响,通过对标准CN60廓形和实测轨距角过渡打磨廓形的插值,得到了一组对应不同磨耗量的钢轨廓形.以某型动车组为研究
针对Vienna整流器非线性系统,提出了内环采用模型预测直接功率控制(MPDPC),外环采用滑模变结构控制(SMVSC)的双闭环控制策略.首先建立其数学模型,求出整流器输入功率和中点电
针对K-means聚类算法存在初始聚类中心影响聚类精度的问题,提出采用生物地理学算法优化K-means聚类中心,使其能提高聚类算法的准确率.在基准数据集中对本算法进行实验,其结果
为了解决磨矿过程这一典型的复杂工业过程的优化控制问题,基于某选矿厂的两段全闭路磨矿流程展开研究,提出了基于模糊规则和案例推理相结合的磨矿专家系统控制方法,解决了实
针对永磁同步电机(PMSM)速度跟踪控制问题,设计了一种自学习滑模反步抗扰控制方法.该方法设计了基于类Sigmoid函数的改进型跟踪微分器(TD)用于对输入信号和虚拟控制信号进行
群机器人协作围捕多个入侵者的问题是一个富有理论和工程应用价值的问题.针对这一问题提出了一种基于人工力矩的自组织围捕方法.首先基于同盟、围捕曲线等概念给出了围捕机器
根据国内外有轨电车地面供电技术的现状,提出了电气车辆分段间隔式地面供电系统方案和实现方法,从判断地面供电状态和车载不间断电源充放电控制策略2个方面对系统的运行控制
她是影响70年代的超模,有过多段恋情,近日与默多克高调订婚并结为连理,从老默多克当下的状态看,霍尔真的给了他又一个春天。  1月10日的美国金球奖颁奖典礼有三大亮点:一是奥斯卡“千年陪跑”莱昂纳多·迪卡普里奥拿下自己的第三座金球奖杯;二是在唱歌事业上一蹶不振的Lady Gaga转战影视圈,拿下“迷你剧或电视电影类最佳女主角”;最后就是84岁的新闻业巨头鲁伯特·默多克牵手59岁的超模杰莉·霍尔亮相,