多Agent强化学习方法与应用

来源 :福建电脑 | 被引量 : 0次 | 上传用户：qncy1235p

【摘要】

：

强化学习是Agent通过试错与环境交互改进动作策略,单Agent强化学习能够进行自学习和在线学习,单Agent的知识和资源是有限的,多个Agent强化学习是求解复杂问题的有效途径。多A

【作者】

：

郭凌云

【机构】

：

河南师范大学计算机与信息工程学院

【出处】

：

福建电脑

【发表日期】

：

2015年5期

【关键词】

：

多Agent 强化学习对策论 POMDP

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

强化学习是Agent通过试错与环境交互改进动作策略,单Agent强化学习能够进行自学习和在线学习,单Agent的知识和资源是有限的,多个Agent强化学习是求解复杂问题的有效途径。多Agent系统比单Agent具有更强的问题求解能力,但多Agent的参与又增加了问题的复杂性。本文分析了多Agent强化学习方法的研究现状,总结了目前存在的主要问题及其解决方法,最后介绍了多Agent技术在实际问题中的部分应用。

其他文献

长链非编码RNA GUARDIN调控细胞衰老的机制研究

细胞衰老是一种不可逆的细胞休眠状态,由多种机制驱动,如端粒缩短导致的复制衰竭、癌基因激活、基因毒性、营养和氧化应激等。这些机制通常在DNA损伤反应(DDR)累积的基础上,

学位

长链非编码RNAGURARIN细胞衰老LRP130-PGC1αp21雷帕霉素

过表达LL37的肺成体干细胞对肺损伤和感染的保护作用研究

研究背景呼吸系统主要行使通气和换气功能,对维持人体的正常生命活动非常重要,呼吸系统的完整性依赖于其自身的先天免疫系统,它可保护人体免受各种微生物的感染并且对炎症反

学位

肺损伤肺纤维化肺感染远端气道干细胞抗微生物多肽LL37

对地勘单位经营者实行年薪制的探讨

期刊

地勘单位经营者年薪制考核指标收入分配制度改革

伊斯兰国家如何看待妇女的着装规范

近年来，妇女在公共场合的着装问题，成为伊斯兰国家普遍关注的一个热点话题。最近，美国一机构在突尼斯、埃及、伊拉克、黎巴嫩、巴基斯坦、沙特阿拉伯和土耳其等7个穆斯林人口占

报纸

核电厂指套管涡流检测技术现状与发展趋势

通过对核电厂指套管降质原因的分析,以及国内外指套管事故实例,说明了我国指套管涡流检测技术应用的现状。综述了指套管涡流检测系统的检测探头、探头定位子系统、探头推拔子

期刊

指套管无损监测涡流检测磨损thimble tubenon-destructive testingeddy current testingabrasion

多Agent强化学习方法与应用

与本文相关的学术论文