论文部分内容阅读
柔性作业车间调度是实现制造业高效率、柔性化和低成本的关键。在车间实际生产制造过程中存在动态不确定性、资源调度复杂性等问题。动态不确定性是指在车间实际生产过程中,车间环境复杂多变,紧急工件插单、机器故障和工件动态到达等动态事件时有发生,使得原有调度方案运作低效、甚至中断。资源调度复杂性是指在柔性作业车间调度中,不仅需要进行工件加工调度,还需要对用于搬运工件的AGV(自动引导小车)进行调度,AGV的搬运路径与工件的加工调度相互影响,统筹柔性作业车间资源分配使得调度方案的确定变得更加复杂。通过及时处理加工过程中发生的动态事件,对柔性作业车间中的机器、AGV等有限资源进行统筹分配,对提高生产调度方案的稳定执行,保证工件的交货期和提高制造系统整体性能,具有一定理论意义和工程应用价值。课题主要围绕考虑多AGV路径规划的柔性作业车间动态调度问题进行研究,主要研究内容如下:(1)基于考虑多AGV路径规划柔性作业车间的生产流程及特点,分析车间动态调度具有的工艺柔性、约束复杂性、多目标性和动态性特性,将考虑多AGV路径规划的柔性作业车间动态调度问题分解为动态调度时刻确定,工件、机器及AGV调度和多AGV路径规划三个子问题,考虑车间布局、机器故障、工件动态到达、紧急工件插单、AGV无轨、AGV之间无碰撞、工件工艺柔性等约束,以最小化工件总延期、机器利用率均衡、AGV利用率均衡、最小化最大完工时间偏差和最小化工序机器序列作为调度目标,以最小化搬运时间为路径规划目标,从而构建动态调度问题的数学模型。(2)研究基于D3QN(对偶双深度Q网络)算法的柔性作业车间动态调度方法。基于车间动态调度流程,采用事件和变周期混合驱动的动态调度策略,当机器故障或紧急工件插单紧急性动态事件发生时,采用事件驱动策略触发调度,若车间中没有紧急性动态事件发生,采用变周期驱动策略触发调度,根据工件动态到达车间的频率和车间的加工负载实现变周期调度,当车间系统时钟满足变周期驱动时刻,触发周期驱动调度。设计调度智能体实现柔性作业车间的资源调度,为全面的表达车间环境的状态并且提高调度算法的泛化性,依据车间的工件信息、机器信息和AGV信息提取9个状态特征作为调度智能体的观测状态空间,分别为与工件相关的工序平均完成率、工件平均完成率、工件完成率标准差、模拟拖期率和实际拖期率,与机器相关的机器平均利用率和机器利用率标准差,与AGV相关的为AGV平均利用率和AGV利用率标准差;根据调度目标,由工件排序选择、机器排序选择和AGV排序选择三类规则组合而成的8个调度决策作为调度智能体的动作;基于实际拖期率、模拟拖期率、机器平均利用率和AGV平均利用率设计4层奖励函数判断调度智能体决策动作的优劣,实现奖励函数与调度目标函数的映射关系。在调度智能体的训练过程中采用经验优先回放机制和目标网络权值软更新机制提高调度智能体的训练速度和稳定性,并设计调度算法与路径规划算法的交互机制。对多AGV路径规划问题进行研究,分析多AGV冲突类型和路径规划流程,采用基于MADDPG(多智能体深度确定性策略梯度)算法的路径规划方法。依据AGV自身位置、目标位置以及其他AGV位置,设计智能体在路径规划环境中的观测状态空间,利用Gumbel-Softmax技巧使策略梯度算法输出离散动作空间,根据最小化AGV搬运时间目标和AGV之间无碰撞约束设计非稀疏奖励函数用于引导智能体的训练,当AGV到达目标位置或靠近目标位置时获得正向奖励,当AGV发生碰撞、远离目标位置或静止时获得负向奖励。最后,利用路径规划案例和动态调度案例对算法进行测试,验证算法的可行性。(3)开发柔性作业车间调度原型系统,分析柔性作业车间的生产需求和流程,设计系统框架、各个功能模块和数据库,基于Py Qt5平台进行原型系统的开发,其中包括登陆模块、车间信息管理模块、调度算法模块、动态调度模块和调度路径展示模块的功能实现,从而对柔性作业车间的生产调度计划进行有意义的指导。