多智能体强化学习综述

来源 :计算机科学 | 被引量 : 0次 | 上传用户:guohuiwh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多智能体系统是一种分布式计算技术,可用于解决各种领域的问题,包括机器人系统、分布式决策、交通控制和商业管理等。多智能体强化学习是多智能体系统研究领域中的一个重要分支,它将强化学习技术、博弈论等应用到多智能体系统,使得多个智能体能在更高维且动态的真实场景中通过交互和决策完成更错综复杂的任务。文中综述了多智能体强化学习的最新研究进展与发展动态,首先介绍了多智能体强化学习的基础理论背景,回顾了文献中提出的多智能体强化学习的学习目标和经典算法,其被分别应用于完全合作、完全竞争和更一般(不合作也不竞争)的任务。其次
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
英语写作能力是学生语言能力的重要体现,然而受诸多因素的影响,大学生英语写作能力并不尽如人意:一方面,学生的语言功底薄弱、汉语思维严重、存在严重的写作焦虑;另一方面,大
随着全球高等教育国际化进程的不断推进,中外合作办学作为其主要表现形式及实现手段之一,受到了各国政府及学界内外的高度重视。本文在对天津外国语大学中外合作项目进行较全
目的观察柴胡加龙骨牡蛎汤治疗甲亢引起的失眠焦虑症患者的临床效果。方法选取2015年6月~2019年12月在我院门诊就诊的68例由甲亢引起的失眠焦虑症患者,分为对照组和观察组,两
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
报纸
在葛双Ⅱ回线路本体造价中,材料费约占85%。而导线费用却占材料费的46%。可见节约导线是降低成本的重要环节。 在本线路架线施工中,我们吸取了以往导线使用方面的经验教训,采取
目前,在中国市场经济体制不断发展的进程中,问题和挑战日趋严峻。对于这些挑战与问题,必须采取相关的有效措施。其中,特别是在企业市场营销层面,仍然有许多现象在与法律空隙
目的观察舒利迭与孟鲁司特钠联合治疗对支气管哮喘患者的效果。方法本次研究选取2018年8月~2019年7月77例支气管哮喘患者纳入本次研究,根据分组后组内实施治疗方法的不同分为
<正>一、郑州市火车拉出来的城市,京汉铁路工人运动对郑州市城市发展的深远影响。郑州地处中原腹地,自然经济结构十分牢固,以致民族资本工业迟迟未能出现。20世纪初,京汉铁路
会议