强化学习在可重入生产系统调度中的应用

来源 :中国科学院沈阳自动化研究所 | 被引量 : 0次 | 上传用户:sad_pacific
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习作为一种解决组合优化问题的方法是近期发展起来的.它结合了神经网络、人工智能、认知科学、仿真和函数近似理论等领域的有关思想,具有解决状态空间巨大和难于建立精确数学模型这两类问题的能力.可重入生产系统是继单件车间和流水车间之后的第三类制造系统.它的最显著特点是,工件在不同的加工阶段多次访问机器.不同加工阶段的工件竞争同一机器这种情况,使得可重入生产系统的调度问题尤其难解.该文研究强化学习在可重入生产系统调度策略优化中的应用.前三章首先介绍了强化学习和可重入生产系统,并对可重入生产系统进行了重新描述,为后续章节的研究提供了必要的基础.第四章讨论基于积累报酬型强化学习方法的封闭可重入生产系统调度策略优化.第五章对基于平均报酬型强化学习的封闭可重入生产系统调度策略寻优这个问题进行了初步研究.直接从所关心的系统品质--平均输出率出发,应用新近提出的平均报酬型暂态差分算法对调度策略进行优化,获得性能优越的动态调度策略.此外,通过仿真验证了对于该算法,可重入生产系统具有相似推广的性质.最后,作者在第六章对全部研究工作进行了总结,并对今后工作进行了展望.
其他文献
该文对停车调查进行了设计,对停车调查技术方法进行了简要阐述,设计了停车调查相关表格,并详细分析了调查的结果.其次,根据威海市的实际情况选择了停车产生率模型和出行吸引
文章研究了齿轮加工数控系统的体系结构,分析了其硬件组成和软件结构;在此基础上研制了YKA7232蜗杆砂轮磨齿面数据控系统,机床运行结果表明该系统稳定可靠、操作方便.同时,针
本文采用质性研究方法,通过对个别高校旅游管理专业本科生的访谈调查,得出有关专业认知度各因素对于其就业意愿的影响结论,进而从学生、学校及社会三方面提出建议,用以强化本
本文在培训观念、 培训形式内容、 培训时间、 培训需求方面提出改善,树立检验员质量培训战略性、 体系性、 全员性的观念,增加多式多样的培训形式和内容,安排合适的培训时间
电液负载模拟器是导弹等武器系统的重要地面模拟设备,其功能是在实验室条件下复现导弹在飞行过程中舵面的受载情况,进而检测出舵机系统的性能,为导弹的成功飞行提供可靠的实
目的 探讨输入性与二代感染新型冠状病毒肺炎(COVID-19)的临床与CT特征.方法 纳入四川省南充地区2020年1月21日~2月18经RT-PCR检测核酸阳性确诊的COVID-19患者25例,根据有无武
箱体作为整个齿轮箱的支撑部件,承受着来自传动系统的各种复杂载荷,常常会受到较大的弯曲、扭转力,和冲击力的共同作用。为了保证其强度和刚度能满足使用要求,往往采用较大的
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
随着我国金融市场的不断完善和发展,互联网金融的创新进一步优化了金融市场的产品结构,但是在金融资源的配置和利用中却存在城乡失衡的问题,严重影响了我国城乡统筹的发展战
有效的管理是促进学校发展的重要条件,科学化与人文化是文化的组成部分,是教育管理的构建要素,同时也是提升小学管理质量的重要保障,因此管理队伍应将科学化和人文化贯彻于小学的