多智能体合作环境下的分布式强化学习

来源 :华中科技大学学报(自然科学版) | 被引量 : 0次 | 上传用户:jiangyao366
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多智能体完全合作环境下学习速度慢及收敛效果不佳问题,提出了基于分布式强化学习的二阶段适应学习方法,依次实现了智能体对环境的适应以及系统内部的协作.在第一阶段,智能体间的强化学习相互独立,以快速适应状态空间环境为主;该阶段中引入对环境的适应性因子,当智能体学习的误差小于该值时,智能体达到了对坏境的较高适应度.第二阶段中智能体采用不同的学习率进行交替适应学习,经过智能体间学习率的调整,实现了智能体学习系统中慢者与快者间的适应,最终形成协作直至收敛.与经典算法仿真结果的比较表明了二阶段适应性学习算法的可行性与高效性. Aiming at the problem of slow learning speed and poor convergence in multi-agent cooperative environment, this paper proposes a two-stage adaptive learning method based on distributed reinforcement learning, which in turn enables the adaptation of the agent to the environment and the collaboration within the system. In the first At the stage, the reinforcement learning between agents is independent, so as to adapt quickly to the state space environment. At this stage, the adaptability factor to the environment is introduced. When the error of agent learning is less than this value, Higher fitness.In the second stage, the agents adopt different learning rates to adapt to learning alternately. After adjusting the learning rate among agents, the adaptation between the slow learners and the learners in the learning system of the agent is realized, The comparison with the classical algorithm shows that the two-stage adaptive learning algorithm is feasible and efficient.
其他文献
我国制荼机械经过几代人的努力已初具规模.各茶类的加工,包括名优茶加工,已基本实现机械化,但与国外先进制荼机械相比,还存在一定差距.制茶机械技术含量不高阻碍了茶叶加工连
随着竞争的加剧,市场调查受到越来越多企业的重视,企业要在消费者意识不断成熟的环境下获取更大的市场,市场调查必不可少.一些在观念和思维上比较超前的企业已经成立了专门的
闭锁综合征又称去传出状态,见于双侧脑桥基底部病变,如梗死、出血、外伤等。患者表现为不能讲话,眼球水平运动障碍,双侧面瘫,舌、咽及构音、吞咽运动均有障碍,不能转颈耸肩,
最近几年中,致密气藏勘探开发在全球范围内迅猛增长。水平井分段压裂技术的出现使得该类非常规资源具有了工业开采价值。然而,致密气藏具有渗透率低、天然裂缝发育等特性,使
广西经济正在步入增速放缓、结构优化、创新驱动的新常态,出口贸易发展方式亟待改变。文章首先使用加权最小二乘法分析一般贸易出口和加工贸易出口对广西经济增长的产出弹性,
目的:探讨糖化白蛋白(GA)、糖化血红蛋白(HbA1c)及其比值(GA/HbA1c)在新诊断2型糖尿病(T2DM)患者降糖过程中变化。方法以70例内分泌科门诊和住院的新诊断T2DM患者为研究对象。所有患者
焦石坝地区是我国第一个非常规页岩气产能示范区。随着勘探开发的不断深入,钻遇水平段漏失井不断增多,且普遍存在承压能力低,压力窗口窄,易发生气窜的现象,严重影响固井质量
作为经典装药方法之一的注装法,因为工艺简单,容易实现,长期以来一直作为主要的装药法,并在此基础上衍生了很多其他装药技术。通过分析注装法的原理、特性,结合国内外对注装
新时代,社区科普面临着新的转型,即应由传统的知识传授转向社区文化建设。在这一过程中,社区科普美育可发挥重要作用。基于社区科普美育,社区科普工作应转型为以居民生活科学
<正> 《中华人民共和国人口与计划生育法》(简称《人口与计划生育法》)的颁布实施是我国人口计划生育事业发展史上一个重要里程碑,它首次以国家法律的形式确立了计划生育基本