基于强化学习的流程工业运行指标优化决策方法

被引量 : 0次 | 上传用户:sust_alex
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年,得益于深度学习的发展和Alpha Go与人类对弈的胜利,深度强化学习受到了学术界和工业界的普遍关注。越来越多先进的强化学习算法被提出,同时,深度强化学习在游戏、机器人和智能驾驶等方面得到了广泛的应用。目前,深度强化学习在工业生产中的应用较少,特别是在运行指标优化决策问题上。运行指标优化决策方法的研究对实现在变化的复杂环境下的生产全流程优化具有重要意义。运行指标优化决策问题就是根据生产环境的工况条件,协调各个生产单元的运行指标,从而优化生产全流程产品的质量和产量。该问题涉及大量的理化反应,难以建立可用的机理模型,而且该优化问题存在复杂的非线性和较强的耦合性,同时,生产环境的变化也存在不规律的现象。针对这一问题,学术界和工业界提出了许多方法,但这些方法通常需要在数据模型中进行求解,其求解的优化精度受建模精度的影响极大,因此,在实际生产中运行指标优化决策主要由工艺工程师根据经验和工艺知识得到可行解。针对上述问题,依托国家自然科学基金项目“数据驱动的复杂工业系统运行优化控制及应用(61525302)”,开展流程工业运行指标优化决策研究,提出了基于深度强化学习(Deep Reinforcement Learning,DRL)的在线自学习运行指标优化决策方法,能够根据工况条件的变化,动态地协调各个生产单元的运行指标。主要工作如下:(1)分析了流程工业运行指标优化决策问题并给出了其数学描述,建立了基于强化学习的全流程运行指标优化决策的框架。通过对流程工业生产全流程运行指标优化决策问题进行详细分析,结合强化学习结构建立了问题的强化学习模型。提出了该问题在强化学习框架并明确了其状态、动作和奖励值的设计。(2)针对流程工业运行指标优化决策问题的高维连续的特征,设计了一种基于Actor-Critic的运行指标优化算法。该算法引入经验回放池,通过经验回放池存储算法交互的大量经验数据,学习和更新过程从经验回放池中随机抽取一批经验数据,避免频繁与工业过程在线交互采样。将所提出的基于Actor-Critic的运行指标优化算法应用到选矿这一典型的流程工业,与人工决策和一种经典的强化学习算法(REINFORCE)进行对比实验研究,结果表明所提出的算法学习过程更短、收敛速度更快、试错次数更少,同时该算法能够保证产品品位合格的基础上有更高的产量。(3)针对强化学习中作为策略函数逼近器的神经网络训练易陷入局部最优的问题,提出了一种基于多动作网络集成的运行指标优化算法。该算法随机初始化多个动作网络(即Actor网络),同时在训练过程中每个动作网络分别从经验回放池中抽取一批不同的数据进行训练。多个动作网络将陷入不同的局部最优策略,通过评价网络(即Critic网络)来评价不同动作网络的动作,从而做出最终决策。结合选矿过程运行指标决策问题,将所提出的算法与第三章提出的基于Actor-Critic的运行指标优化算法进行对比实验研究,结果表明所提出的算法一定程度上克服了动作网络容易陷入局部最优的问题,提高了算法性能。
其他文献
注意力缺陷严重影响孤独症儿童的课堂学习质量。通过开发绘画册作为绘画训练工具,采用跨被试多基线的单一被试实验设计,以3名6—9岁孤独症儿童为个案进行干预训练。研究结果表明,绘画训练能有效提升孤独症儿童的课堂注意力,激发孤独症儿童的参与动机是注意力干预中不可或缺的环节,干预时要重点抓住干预靶行为,包容并允许靶行为之外的非实质性“问题行为”暂时存在。
期刊
目的:探讨盐酸左氧氟沙星(LH)联合替硝唑(TNZ)治疗慢性盆腔炎(CPI)的临床效果。方法:选取2020年7月—2021年10月山东省临沂市兰山区人民医院妇产科收治的CPI患者50例作为研究对象,采用随机数字表法分为对照组和观察组,各25例。对照组给予TNZ治疗,观察组在对照组基础上联合LH治疗。比较两组治疗效果。结果:治疗后,观察组红细胞沉降率、血浆黏度、高切全血黏度、低切全血黏度、C反应蛋白
期刊
为贯彻落实“培根铸魂,启智润心”的教育期望,凸显学校文化的育人功能,无锡市二泉中学借助校本课程的力量,让学校文化有意识地走近学生。学校通过溯源学校特色“泉文化”教育理念,提炼出以培育“若泉君子”为核心的校本课程文化,据此构建“三维九向”的校本课程核心素养观。学校以“厚德、敏学、勇行”三大核心课程群为主体,以“1+X”学科拓展类课程与“综合+”综合主题类课程为具体实施路径,润养学生品行,提升学生素养
期刊
<正>慢性偏头痛显著降低生活质量,在一般人群中有大约2%的发病率,且其治疗并不容易。A型肉毒毒素已用于治疗慢性偏头痛超过10年,其通过降低可量化的指标如头痛频率、持续时间、发作强度、残疾程度,成为一种耐受性良好的慢性偏头痛的预防治疗的首要选择。随着近年来对A型肉毒毒素的研究不断深入,其在慢性偏头痛中的应用会逐渐增加。慢性偏头痛(Chronic migraine, CM)是一种普遍的、致残的神经系统
期刊
<正>有这样一群孩子,他们生活在我们身边,却有着跟大多数人不太一样的大脑,他们以自己独特的方式跟世界互动,他们虽然有一个浪漫的名字——来自星星的孩子,但实际上他们的生存状况并不浪漫。这些孩子就是我们常说的孤独症儿童,医学名称为孤独症谱系障碍。据统计,我国孤独症儿童数量超过200万。出于不了解,有人认为孤独症就是严重孤僻不说话,也有人认为孤独症就是“天才病”,甚至有人会调侃自己得了孤独症,但对于真正
期刊
<正> 本文通过对国外有代表性的商业银行和政策性银行组织架构模式比较分析,试图为农发行组织体系改革提供有益的启示。国外现代银行组织架构模式法人治理结构是现代企业组织结构形成的前提和基础,组织结构从属于法
期刊
目的 调查孤独症谱系障碍患儿治疗依从性现状及其影响因素,以期为促进患儿规范化治疗提供参考。方法 调查时间为2021年3月至2022年3月,以本院收治的孤独症谱系障碍患儿父母为对象进行调查。采用孤独症谱系障碍患儿治疗依从性量表(家长版)进行现场调查。结果 本研究共回收问卷204份,结果显示,孤独症谱系障碍患儿治疗依从性量表得分为(3.61±0.64)分。多因素分析结果显示,患儿母亲受教育程度、患儿年
期刊
报纸
目的 探讨护理干预措施在伴中央颞区棘波的自限性癫痫(SeLECTS)患儿剥夺睡眠脑电图检查中的应用效果。方法 选取2022年7月至11月山东第一医科大学附属人民医院诊治的SeLECTS患儿80例作为研究对象,随机分为干预组及常规组,每组40例。两组患儿均行剥夺睡眠脑电图检查,常规组给予常规指导措施,干预组给予护理干预措施。观察两组剥夺睡眠的依从性及脑电图监测质量。结果 干预组患儿剥夺睡眠依从性明显
期刊
<正>数字化车间是智能制造的重要组成部分,是企业进行智能制造的核心场所。《中国制造2025》中明确提出,数字化车间是智能制造工程的重点建设内容之一。数字化车间依托信息技术、测控技术以及人工智能技术等先进手段,对“人、机、料、法、环、测”等生产设备、生产资源、工艺流程、生产设计、车间运行及人员等进行精细、高效的数字化规划和管理控制,从而实现智能化的制造过程。本期杂志特别策划了数字化车间专题,助力制造
期刊