【摘 要】
:
现实的自动化生产线中,有一类由传送带将工件送至配有缓冲库的加工站进行加工的生产系统,称之为传送带给料加工站(Conveyor-Serviced Production Station,简称为CSPS)。作为
论文部分内容阅读
现实的自动化生产线中,有一类由传送带将工件送至配有缓冲库的加工站进行加工的生产系统,称之为传送带给料加工站(Conveyor-Serviced Production Station,简称为CSPS)。作为当今智能生产领域中一种重要的、具有代表性的抽象模型,其最优控制问题的研究具有重要的现实意义。本文主要考虑一类面向多个品种工件加工的单站点CSPS系统的优化控制问题。该系统中,不同品种工件按照独立泊松过程沿传送带随机到达,站点配有相应缓冲库存放各品种未加工的工件,不同品种工件的加工时间服从不同参数Erlang分布。系统的优化目标是通过选择最优的前视距离策略,协调各品种工件到达过程和服务过程,力求在提高生产率的前提下,平衡各品种工件的生产。论文首先以系统中各缓冲库的剩余量为状态,站点的前视距离为控制决策变量,无穷时段期望代价最小为优化目标,将其最优控制问题建模为半Markov决策过程(SMDP),给出了系统随机动态矩阵和性能函数矩阵。该模型的建立为引入理论优化和强化学习优化算法提供了数学基础。在仿真计算中,分析研究了多品种CSPS系统的缓冲库容量最优设计问题,给出了策略迭代算法和Q-学习算法的优化曲线,并分析讨论了各品种工件的到达率和服务率对系统性能的影响。仿真结果验证了模型的合理性和方法的有效性。由于系统的状态空间随工件品种数量和缓冲库容量的增加呈指数增长,存在“维数灾”现象,导致理论算法的求解速度和Q-学习算法的学习速度大幅度降低。因此论文将原始状态空间划分为多个不相交的子集,每个子集用一个抽象状态表示,减少了系统状态空间的维度和大小,引入Q-学习算法在抽象状态空间上进行学习和优化。实验结果表明,该方法优化速度更快,对每个抽象状态的学习更充分,优化效果更好。
其他文献
随着计算机软硬件的发展,目标跟踪技术在军事、交通管制、智能监控、GPS导航等多个领域得到了应用,相关的算法的研究日益深入。粒子滤波因其在非线性、非高斯系统的状态估计
与/或树是用于表示问题及其求解过程的一种形式化方法,它为问题的解决提供了一种问题归约的方法。Petri网是一种系统建模工具,由于其异步、并发的特性很适合描述动态系统,因
软件体系结构是软件工程领域中发展迅速的一个研究领域。软件体系结构是指系统中构件、连接件和它们之间的连接和配置等,是对软件系统的一个高层次的描述。根据软件体系结构
信息技术的发展使许多医院、社区医疗机构、医疗研究机构或企业中产生着大量的临床数据、病例资料、病历档案等健康数据。在这些包含了时间、空间信息的多维健康数据中蕴藏着
单片机技术经过几十年蓬勃的发展,正处于片上系统SoC阶段。由于单片机技术重视实践,因此教学实验系统在单片机教学中显得不可或缺的。本文所讨论的教学实验系统采用片上资源
文摘准确全面地反映某一文档或多文档的中心内容。在当今信息爆炸的背景下,各种信息的增长速度远大于手工文摘的处理速度。因此,人们需要一种快速浏览信息的工具,该工具直接
传统的系统构建方法已经难以满足顾客日趋个性化、复杂化和多变化的服务系统开发需求,服务工程方法体系的研究已经成为必然的发展趋势。基于服务模型驱动体系结构的服务工程
随着网络技术的快速发展,保证网络的安全也显得越来越重要。入侵检测系统通过收集和分析系统日志或者网络数据来检查系统或网络中是否存在违反安全策略的行为和被攻击的迹象
流媒体技术起源于窄带互联网时期,自1995年推出第一个Internet流媒体播放器以来,流媒体应用有了爆炸性增长。流媒体采用“边下载、边输出”的流式传输,这不仅使启动延时大幅的缩
随着Internet和Web技术的广泛应用,基于B/S的多层Web体系结构逐渐发展并成熟起来,越来越多的企业都迫切要求高效地构建自己的Web业务系统。Sun公司发布的J2EE技术规范提供了一