论文部分内容阅读
研究任务调度优化系统问题。任务调度问题的主要难点在于复杂度太高,传统的基于任务调度Q学习算法更新收敛速度慢。针对协同工作中的任务调度实际问题,提出了一种基于模拟退火的改进的Q学习算法。算法首先建立任务调度目标模型,在分析了Q学习算法的基础上,通过引入模拟退火算法,同时结合贪婪策略,以及在状态空间上的筛选判断,并给出了任务调度的整个过程。仿真结果表明,与单一的Q学习任务调度算法相比,改进的算法显著地提高了收敛速度,缩短了执行时间。从而验证了改进算法的有效性。