局部合作相关论文
频谱资源异构性是5G通信系统的重要特性之一。为实现频谱资源分配与需求的最优匹配,关注5G微蜂窝的异构信道选择问题。针对该问题,传......
针对RoboCup(Robot World Cup)中,多Agent之间的配合策略问题,采用了一种局部合作的多Agent Q-学习方法:通过细分球场区域和Agent回报值......
强化学习在多Agent系统中面对的最大问题就是随着Agent数量的增加而导致的状态和动作空间的指数增长以及随之而来的缓慢的学习效率......
本文在前人研究基础上,加入物流商这一供应链决策主体,研究了包含第三方物流商的易腐商品供应链中的最优决策与合作问题。分别研究了......
多智能体Q-学习问题往往因为联合动作的个数指数级增长而变得无法解决。从研究分层强化学习入手,通过对强化学习中合作MAS的研究,在......
针对多智能体Q-学习中存在的联合动作指数级增长问题,采用-种局部合作的Q-学习方法,在智能体之间有协作时才考察联合动作,否则只进行......