多步Q学习相关论文
强化学习是目前智能体和机器学习研究的热点。针对强化学习中标准Q学习算法更新速度慢的缺点,通过引入多步信息更新策略和模拟退火......
通过分析模具制造项目工期、费用与报酬的不确定性以及模具返修、随机插单等突发事件频繁发生的特点,构建了基于离散时间马尔可夫链......