基于 MarkoV对策和强化学习的多智能体协作研究

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户:cyf1122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
MAS的协作机制研究,当前比较适用的研究框架是非零和Markov对策及基于Q-算法的强化学习.但实际上在这种框架下的Agent强调独立学习而不考虑其他Agent的行为,故MAS缺乏协作机制.并且,Q-算法要求Agent与环境的交互时具有完备的观察信息,这种情况过于理想化.文中针对以上两个不足,提出了在联合行动和不完备信息下的协调学习.理论分析和仿真实验表明,协调学习算法具有收敛性.
其他文献
心衰的许多表现源于神经内分泌系统对心功能不全的反应。正常人心脏在静息时不受交感神经刺激影响,心衰时由于心室功能下降,通过压力感受器激活交感神经系统,血浆去甲肾上腺
本文报告—遗传性因子ⅩⅢ缺乏症家系,先证者临床表现典型,经因子ⅩⅢ测定及交叉试验以及因子ⅩⅢa,b亚基抗原含量测定而确诊。调查了7个家系成员。讨论了该病的发病机理及遗
小组学习模式是课改下有效的教学方式之一,也是凸显学生课堂主体性,加强生生交流的有效方式之一。所以,在新课程改革下,我们要改变以往单一的“灌输式”教学模式,要认真贯彻
期刊
三磷酸腺苷(ATP)治疗阵发性室上性心动过速(PSVT)自五十年代就有报道,然而,其疗效直到最近才被确认。我们于1985年2月开始结合食道电生理检查观察ATP 对 PSVT 的治疗效果及
本刊讯 2016 年10月21日,2016英特尔中国行业峰会在珠海召开.来自金融、能源、医疗、交通、零售、教育等行业的专家、企业高管、英特尔业务负责人以及合作伙伴参加了大会.峰
本文对46例骨髓增生异常综合征(MDS)病人进行了连续的形态学和细胞遗传学研究。46例的FAB分型为:难治性贫血(RA)25例,获得性原因不明铁粒幼细胞贫血(AISA)11例,RA伴原始细胞
济南名泉多如繁星,或在深巷竹石之间,或在平野山川之中,周流罗贯于济南数十里,清水渺渺,柳岸依依,川流不息,素以“泉城”闻名中外。古往今来,它那“家家泉水、户户垂杨”,“
窦房结电图(SNE)检查的开展解决了体表心电图无法解决的I°窦房传导阻滞(S-AB)的诊断问题。现将我们一例经窦房结电图证实的I°S-AB合并Ⅱ°二型房室传导阻滞(A-VB)报道如下
期刊
减少化学农药使用,与保护生态环境、食品安全密切相关,但生物农药等绿色防控技术,却往往遭遇“叫好不叫座”的困境。记者近日在济源市王屋镇柏木洼村发现,这里的农业病虫害防控方式已悄然转变。  1困境技术复杂习惯难改  柏木洼村几乎家家种菜,全村1300亩农田中1000亩是蔬菜。在种植大户张树杰的大棚里看到,各种颜色的粘虫板随处可见。  张树杰告诉记者,过去种菜全靠化学农药,生物农药没人用。  济源市白云
期刊