非泊松工件流CSPS系统优化控制仿真研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:fengraul
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传送带给料加工站(Conveyor-Serviced Production Station,CSPS)系统作为一种典型的智能决策系统被广泛应用在柔性生产加工站上。目前CSPS系统的优化控制研究往往将工件和需求的到达过程建模为泊松过程,然后将系统建立为半马尔可夫决策过程(Semi-Markov Decision Process Model,SMDP)模型后,通过策略迭代或是Q学习来获得最优或次优控制策略。但是当工件非标准泊松到达时,工件的到达过程不满足马尔可夫性。当CSPS系统无法建立为SMDP模型时,Q学习的学习效果如何是一个值得研究的问题。因此本文研究当工件非泊松到达时,Q学习算法的适用性问题。首先以马尔可夫调制泊松过程(Markov Modulated Poisson Process,MMPP)和半马尔可夫调制泊松过程(Semi-Markov Modulated Poisson Process,SMMPP)作为非标准泊松到达的典型代表,在相同的平均到达率情况下,分析对比工件以标准泊松流和非标准泊松流两种情况到达时的Q学习结果,并观测以统计平均到达率作为工件标准泊松到达率的理论学习情况,以检验算法性能;其次讨论当两品种工件以MMPP和SMMPP的混合信号流到达时Q学习的适用性问题。另外,在工件非泊松到达的基础上,进一步研究顾客需求也不服从泊松分布情况下,算法的适用性问题。仿真结果证明,在非泊松工件流CSPS系统无法建立为SMDP模型时,Q学习依然可以学到较好的控制策略,以相应的控制策略评估的系统代价与以非泊松工件流的理论平均到达率作为工件标准泊松到达率情况下Q学习统计出的系统代价非常接近;当两品种工件以MMPP和SMMPP的混合信号流到达时,Q学习也能学到较好的控制策略。另外,在工件非泊松到达的基础上,顾客需求也不服从泊松分布情况下,Q学习依然能学到较好的控制策略。
其他文献
国际金融领域自由发展,我国也逐步放松了对金融行业的管控,但当下,我国商业银行的发展正面临严重的危机,产品同化现象使得银行竞争地位岌岌可危,对商业银行今后的发展带来严
提供一种基于SCARA工业机器人的螺母装配工作站设计,可实现多工位、多配件螺母装配生产需要。工作站采用环形结构,工件位于圆环中心,四周环绕垫圈、弹性挡圈等配件的上料及装
目的探讨青蒿素(ART)和双氢青蒿素(DHA)对大鼠肝内组成型雄烷受体(CAR)和细胞色素P450s(CYP450s)的诱导作用。方法 SD大鼠随机分为8组:口服ART诱导组(80mg·kg^-1·d^-1);口服DH
随着我国经济发展进入新常态,商业银行所面临的内外环境压力越来越大。一方面,利率市场的推进导致资本市场波动频繁,商业银行发展中面临的资本不确定性因素增多;另一方面,央
急性时相反应是机体在受到外伤、炎症和病原感染时,机体发生广泛的生理反应。参与急性时相反应的物质称为急性时相反应物(acute phase reactant)。急性时相反应物大多数是蛋
目的:目前应用于主动脉瓣置换(aortic valve replacement,AVR)的生物瓣膜疗效仍存在较大争议。本文对已发表的研究主动脉瓣生物瓣膜置换相关研究进行了系统回顾及meta分析,并
研究背景和目的微小核糖核酸(microRNA,miRNA)是一类由18-25个核苷酸组成的内源性单链非编码小分子RNA。作为一类重要的调节分子,其通过完全或不完全互补的方式与靶mRNA的3’
目的 观察恢刺“肩三针”配合牵张手法治疗肩关节周围炎(以下简称肩周炎)的临床疗效,为探索提高肩周炎临床治疗效果提供科研基础和思路,拟形成一套规范化肩周炎治疗方案。方法 将符合纳入标准的90例门诊肩周炎患者随机分为治疗组和对照组各45例,治疗组采用恢刺“肩三针”(肩髁、肩髎、肩前)配合牵张手法治疗,对照组采用常规针刺推拿治疗。两组均隔日治疗1次,10次为1个疗程,1个疗程结束后,观察两组的临床疗效、
本文首先对全面预算管理模式在银行中应用意义进行阐述,从部门参与度不高、预算编制缺少合理性、预算执行力度有待提升三个方面,对银行全面预算管理模式应用存在的问题进行解
基本公共文化服务体系建设是县域推进城乡一体化的重要组成部分。在社会的不断进步中,人们的生活水平越来越高,随之而来的,是对精神文化的最求,因此,在社会经济不断发展的今