基于强化学习的多成品率衰变设备预防维修策略

被引量 : 2次 | 上传用户:liuj_csip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在制造系统的生产过程中,生产设备状态的衰变会降低产品的质量水平,导致多成品率质量问题。本文针对此类具有多成品率质量问题的衰变设备,建立部分可观马尔可夫决策模型,采用基于强化学习的预防维修(RLPM)策略来求解。首先,本文描述了衰变设备的维修问题,并建立部分可观马尔可夫决策模型,考虑两类检测误差及一系列收益和成本参数,通过一种基于平均奖励的强化学习算法—Q-learning算法,根据每组系统观测信息,即产品质检数据和距离上次维修以来的时间,做出最优维修决策,决定是否触发维修行动,从而最小化系统
其他文献
运动控制已逐步成为一个新的研究热点,而运动控制系统中的非线性摩擦力的补偿技术,也已成为备受控制工作者关注的课题.在机器人、机床、无线电天线和天文望远镜等运动控制系
将微电子、微处理器和现场总线技术应用于低压开关电器的改造中,所设计出的可通信低压开关电器,能实现传统低压电器元件功能的组合化和智能化,并能够通过总线通信技术的应用实现低压电器控制的系统化和自动化,它代表着21世纪低压电器的一个重要的发展方向。本文通过对国内外可通信低压开关电器产品以及现场总线技术进行研究和比较,归纳出可通信低压开关电器设计中的一些典型模块并选择了CAN总线作为通信手段。然后我们具体
不确定非线性系统控制是目前控制理论研究的一个重要课题。由于非线性系统的复杂性,非线性系统的控制问题一直是一个难点。本论文针对不确定非线性系统,将自适应控制的方法应用
分布式数据采集系统主要是把分散于各处的参数采集到监控中心,以便于进行管理和监控。其最大的特点就是数据采集现场比较分散,且现场和监控中心之间的距离比较远。因此,分布式数
对嵌入式设备应用Web服务完成远程监控功能具有多方面优势。随着嵌入式Internet的出现,嵌入式设备可以直接接入Internet进行Web监控,将成为今后远程监控技术发展的主流方向。
随着海洋资源的不断开发以及其他海洋工程的需要,海洋工程船舶的作业范围正在不断的向深海、超深海深入,对工程船舶装备的动力定位系统的要求也越来也高。深海作业时工程船舶
论文对中医舌诊客观化中的两个重要问题——舌图像的彩色重现问题和舌象纹理、形态特征的分析方法进行了研究.主要工作可分为以下四个部分:首先,论文分析了舌图像采集、显示
本文从实际问题出发,以济南卷烟厂为例,设计了能源监测和管理系统.为了节能降耗,提高经济效率和管理水平,按照济南卷烟厂的设计研制的微机能源监测和管理系统可对锅炉房、空
在我国经济社会发展的转型期,国家面临着诸多社会风险的威胁和挑战。突发事件时有发生,且已影响社会和谐和经济发展。开展突发事件应急管理相关研究对促进社会和谐有着重要意义
城市化是工业化的产物,也是发展中国家迈向发达国家历程中的必经之路.虽然与世界发达国家相比,目前中国的城市化水平仍然很低,城市化过程中存在着很多问题,但中国的城市化进