多Agent强化学习

来源 :第四届中国Agent理论与应用学术会议 | 被引量 : 0次 | 上传用户:whhuazi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  多Agent系统分为合作型、半竞争型和竞争型。根据多Agent系统中Agent目标的不同,多Agent强化学习被分为合作多Agent强化学习、基于平衡解的多Agent强化学习、基于最佳响应的多Agent强化学习三大类。报告从学习效率、平衡解、不遗憾性等多个角度介绍了不同的多Agent强化学习,报告提出一种基于元平衡的多Agent强化学习,并给出三类学习方法的统一框架。
其他文献
目的 了解浙江省绍兴市气温对其他感染性腹泻发病的影响及其归因风险,为其他感染性腹泻的预防控制提供参考依据.方法 收集绍兴市2014年1月1日-2016年12月31日其他感染性腹泻
以科尔沁沙地差不嘎蒿(Artemisia halodendron)为研究对象,以中亚草原蒿(Artemisia depauperata)为外类群,研究不同生境梯度下差不嘎蒿种群核糖体DNA的ITS序列间差异。结果表明:排序后的差不嘎蒿ITS序列总长度为696bp,ITS-1和ITS-2长度分别为253~256bp和264~269bp、G+C含量的变化范围分别为54.02%~54.77%和56.75
  通过对青海湖湖东沙地风成沉积剖面化学元素特征的分析,结合光释光测年结果,并和已有研究进行对比,探讨了青海湖区12.5 ka BP以来的气候环境变化过程,将其划分为5个阶段:12.5
会议
豆辩菜也叫绿色豆芽菜,栽培过程中不用缸,不用企,只是在地面上做畦即可生产。由于在生产过程中不用化肥,不用农药,完全符合绿色食品标准,其味道清香臾口,不滑不腻,浓香如始,色、香、味
  于2011年5-8月,选择腾格里沙漠东南缘人工固沙植被区藻类、藓类和混生结皮覆盖的土壤为对象,研究了极端降雨量(降雨量44.7 mm、强度0.04 mm·min-1)、极端降雨强度(降雨
会议
为了摸清妇女病发病情况,了解其发病原因,探索发病规律,从而制定有效的防治措施,我们于1983年6月和1984年8月对黑龙江省克山具城乡已婚妇女593人进行了调查,结果如下。对象
鄂豇1号是于1982年以红嘴燕为父本,广东白皮为母本采用人工有性杂交,在分离后代中按系谱选择法,经过6a(年)(一年两代)的定向系统选择而成的。该品种荚色银白,肉厚质嫩,耐老化,产量与之豇-28相当,但
第1期。Br.canis感染豚鼠白{}实验研究………………··…”……………叩尚德秋李兰玉牛布鲁氏菌病诊断中应甩EDTA试验的比较及评价…………...……卿燕等固相放射免疫试验检
目的:探讨闭合折顶整复手法结合杉树皮外固定夹板治疗儿童尺桡骨远端双骨折的手法操作及其临床疗效.方法:自2017 年1 月至2019 年12 月,采用闭合折顶整复手法治疗儿童尺桡骨
为了解HDV在我市感染情况,我们用ELISA法对214例HBsAg阳性血清进行抗-δ检测,试剂由中国预防医学科学院病毒学研究所提供。结果:检出抗-δ阳性1例,阳性率为0.5%,该例阳性者,