论文部分内容阅读
针对知识化制造系统生产环境的不确定性,构建一个基于多Agent的知识化动态调度仿真系统.为了保证设备Agent能够根据当前的系统状态选择合适的中标作业,提出一种基于聚类-动态搜索的改进Q学习算法,以指导不确定生产环境下动态调度策略的自适应选择,并给出算法的复杂性分析.所提出的动态调度策略采用顺序聚类以降低系统状态维数,根据状态差异度和动态贪婪搜索策略进行学习.通过仿真实验验证了所提出动态调度策略的适应性和有效性.