【摘 要】
:
强化学习在车间调度上获得了较低的时间响应和较优的模型泛化性.为阐述基于强化学习的车间调度问题整体研究现状,总结当前基于强化学习的调度框架,同时为后续相关研究奠定基础,介绍了车间调度与强化学习的背景,分析了车间调度问题中常用的2种仿真技术,给出了强化学习解决车间调度问题的2种常用架构.此外,针对强化学习在车间调度问题上的应用,指出了现存的一些挑战,并对相关研究进展从直接调度、基于特征表示的调度、以及基于参数搜索的调度3个方面进行了介绍.
【机 构】
:
北京航空航天大学,北京100191;复杂产品先进制造系统教育部工程研究中心,北京100191
论文部分内容阅读
强化学习在车间调度上获得了较低的时间响应和较优的模型泛化性.为阐述基于强化学习的车间调度问题整体研究现状,总结当前基于强化学习的调度框架,同时为后续相关研究奠定基础,介绍了车间调度与强化学习的背景,分析了车间调度问题中常用的2种仿真技术,给出了强化学习解决车间调度问题的2种常用架构.此外,针对强化学习在车间调度问题上的应用,指出了现存的一些挑战,并对相关研究进展从直接调度、基于特征表示的调度、以及基于参数搜索的调度3个方面进行了介绍.
其他文献
随着人们对水资源的利用逐年增加,城市水资源短缺问题也日益严重,如何高效、科学地利用水资源,已成为水资源管理的重要内容.本文利用GIS、云计算以及物联网等先进技术,构建了水资源实时监控大数据资源中心,搭建了水资源实时监控平台,实现了水资源数据的展示、查询和统计,水资源实时监控、水资源取水用水管理以及水资源应急管理等功能,有效地对水资源进行了优化和合理配置,提高了水资源利用的效率.
本文首先阐述了声波在弹性介质中的传播特征及原理,介绍了EdgeTech SB-216S型浅地层剖面仪和GEO-Spark 1000 Plus单道地震系统的发射声波的原理及特征,然后分析了各自提高分辨率和穿透能力的技术手段,最后根据实际的近岸海洋工程探测数据分析了两种系统各自的最佳使用范围.
为摸清城市市容环卫管理各项部件的数量、类别以及分布等情况,急需一套高效的管理平台来实现市容环卫部件的信息化、精细化以及智能化管理.本文根据实际业务需求,利用GIS、GPS、云计算、移动互联等先进技术,搭建了市容环卫部件综合管理平台,介绍了平台建设的目标、平台架构、相关功能模块以及实现的关键技术,实现了市容环卫部件图文表一体化管理、二三维一体化展示以及动态巡查和更新等,有效提高了工作的效率和管理水平.
为彻底解决现有多级制图数据库维护困难,研究基于“一源图”架构的多源数据融合与信息补偿技术,以固定数据精度标准建立制图要素数据库,进行地理实体要素由空间数据向制图数据的转化,在有限的制图专家知识库辅助下,实现了一次建库,可以多级、多场景使用.通过应用实践证明,能在较短时间内生产出更专业、更精美的地图产品,有效缩短了地图的制图时间,解决了地图生产的低效率与地图服务高要求之间的矛盾.
为了快速高效地从LiDAR点云中自动准确地提取中桩、横断面数据,在CAD中利用VBA二次开发了基于LiDAR点云的横断面自动提取程序.该程序根据道路逐桩坐标表以及桩号,计算各中桩的法线方向,然后根据坐标范围查找点云构建三角形并内插高程,实现了根据实测中桩自动提取横断面数据、根据点云中桩自动提取横断面数据、点云数据自动提取中桩高程、点云数据自动提取任意坐标高程,并对实测中桩和点云中桩数模进行精度统计.横断面以纬地横断面格式呈现,点云中桩格式和任意坐标点云高程格式为南方CASS软件数据格式,本程序自动提取点云
为实现对土地违法事件执法监察管理的信息化和规范化管理,本文利用GIS、GPS、移动互联以及网格化等技术,对现有土地违法事件执法监察管理模式进行优化,整合地理信息、土地违法事件数据、土地执法专题数据等,构建城市土地执法监察“一张图”数据库,开发土地执法监察管理平台.该平台实现市、区、乡镇、村四级土地违法事件全过程执法监察管理的互联互通,有效提高城市土地执法监察管理水平.
COVID-19大流行期间,制造企业供应链将面临更为严峻的产品需求不确定性,具体表现为某类产品需求激增且原材料供应波动变大.针对这种具有需求不确定性的供应链优化问题,建立了以企业利润和产品订单满足率最大化为目标函数的多目标随机规划模型,设计了一种基于NSGA-Ⅱ和仿真计算资源分配策略自适应结合的进化多目标仿真优化算法,通过算例仿真验证了所提出的模型和算法的有效性.
针对地理信息系统多源数据异构冲突导致的整合误差问题,提出基于多源数据集成的地理信息系统数据高效整合方法.集成地理信息系统的多源数据后,采用K关联的方式规划数据结构,匹配地理信息数据属性后,建立数据整合算法.采集并整理实验所需的数据后,研究结果表明:所设计的数据整合方法不仅可以控制数据异构,还能够准确地消除误差,研究结果可应用于地理信息系统数据整合过程中.
针对供应链中断问题,提出2个供应链恢复策略—供应商预设紧急库存策略和制造商进行产品变更策略,同时还考虑了紧急库存的存储成本和变更后产品的退货率.为了最大化制造商的利润和顾客满意度,分别建立了单目标和双目标模型.将2个模型中的优化问题转换为混合整数规划问题并基于I OG CPLEX给出了相应的求解算法.仿真结果表明:所提的中断恢复策略不仅可以有效地帮助供应商止损,并且可以很好地满足市场需求.
为进一步提高交通仿真模型的准确性,使仿真模型能够及时响应交通需求和驾驶行为的变化,开发了检测数据驱动的动态仿真参数标定方法.提出了检测数据与仿真平台的动态交互方法,选取了北京市光华路/金桐东路交叉口和包头市友谊大街连续5个交叉口作为案例进行了研究.针对初始参数集合进行了敏感性分析,基于分析结果选择所需标定的参数,在VISSIM仿真平台中对案例进行了建模并标定了其驾驶行为参数.仿真结果表明,相比于静态参数标定方法和简单规则动态标定方法,所提方法误差最小,但是选择参数的过程耗时相对较长.