A new accelerating algorithm for multi-agent reinforcement learning

来源 :Journal of Harbin Institute of Technology | 被引量 : 0次 | 上传用户:khsim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
In multi-agent systems, joint-action must be employed to achieve cooperation because the evaluation of the behavior of an agent often depends on the other agents' behaviors. However, joint-action reinforcement learning algorithms suffer the slow conve
其他文献
研究了具有高阻抗的电磁带隙(EBG)的双层平面型金属-电介质周期性单元结构,此类结构的特定频率的表面波抑制和同相位反射性质在微波天线及高速电路中有广阔应用前景.本文根据Si
为加快安徽省青阳县的高标准基本农田建设,开展更加精准的水稻种植适宜性评价,本文根据研究区土地质量地球化学数据和当地水稻对生长环境的需求,通过层次分析法(AHP)把水稻种
This paper proposes a joint layer scheme for fair downlink data scheduling in multiuser OFDM wireless networks. Based on the optimization model formulated as th
建立了荒漠植物总脱氧核糖核酸分子(DNA)的提取方法.荒漠植物叶片加少量交联聚乙烯吡咯烷酮(PVPP粉末)研磨三次以上,得到样品超细粉末.样品粉末迅速加入前处理缓冲液,混匀后
2005年以来,各垦区和贫困农场以邓小平理论和"三个代表"重要思想为指导,深入贯彻落实科学发展观,坚持以人为本,以发展壮大农场经济、提高职工群众生活水平和构建垦区和谐社会为
本次国际金融危机使得发达地区加速向中西部进行产业转移,安徽作为产业转移的桥头堡和中间枢纽,无疑具有地域优势。安徽应随产业转移和城市化进程加快而起舞,并审时度势及早
分析了现有预测室内电波传播的2-D/3-D混合算法模型的不足,提出一种修正模型,该模型建立在环境的二维对地平面图基础上。在建立可见性树时,结合实际三维环境的特点引入分别相对于
基于矩形金属波导-多层基片集成波导(RWG—MLSIW)功分器技术实现了宽带功率合成。RWG-ML—SIW结构组成比较简单,就是将一组基片集成波导层叠并紧密地插入到矩形金属波导内,通过这
农垦事业伴随伟大祖国日新月异的快速发展进入了新的历史时期。发展现代农业、推进社会主义新农村建设、构建社会主义和谐社会,迫切需要建设一支规模结构合理、素质能力优良的