多Agent强化学习方法与应用

来源 :福建电脑 | 被引量 : 0次 | 上传用户:qncy1235p
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强化学习是Agent通过试错与环境交互改进动作策略,单Agent强化学习能够进行自学习和在线学习,单Agent的知识和资源是有限的,多个Agent强化学习是求解复杂问题的有效途径。多Agent系统比单Agent具有更强的问题求解能力,但多Agent的参与又增加了问题的复杂性。本文分析了多Agent强化学习方法的研究现状,总结了目前存在的主要问题及其解决方法,最后介绍了多Agent技术在实际问题中的部分应用。
其他文献
细胞衰老是一种不可逆的细胞休眠状态,由多种机制驱动,如端粒缩短导致的复制衰竭、癌基因激活、基因毒性、营养和氧化应激等。这些机制通常在DNA损伤反应(DDR)累积的基础上,
研究背景呼吸系统主要行使通气和换气功能,对维持人体的正常生命活动非常重要,呼吸系统的完整性依赖于其自身的先天免疫系统,它可保护人体免受各种微生物的感染并且对炎症反
近年来,妇女在公共场合的着装问题,成为伊斯兰国家普遍关注的一个热点话题。最近,美国一机构在突尼斯、埃及、伊拉克、黎巴嫩、巴基斯坦、沙特阿拉伯和土耳其等7个穆斯林人口占
报纸
通过对核电厂指套管降质原因的分析,以及国内外指套管事故实例,说明了我国指套管涡流检测技术应用的现状。综述了指套管涡流检测系统的检测探头、探头定位子系统、探头推拔子