多agent协同强化学习算法SE—MACOL及其应用

来源 :广西师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户：guozhi1988

【摘要】

：

针对多agent团队中各成员之间是协作关系且自主决策的学习模型，在此对Q学习算法进行了适当扩充，提出了适合于多agent团队的一种共享经验元组的多agent协同强化学习算法。其中采

【作者】

：

王长缨陈文伟

【机构】

：

济南军区装备部自动化站,国防科技大学信息系统与管理学院

【出处】

：

广西师范大学学报(自然科学版)

【发表日期】

：

2006年4期

【关键词】

：

多AGENT学习强化学习 Q学习状态行为空间协作团队 multi-agent learning reinforcement learning Q-

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对多agent团队中各成员之间是协作关系且自主决策的学习模型，在此对Q学习算法进行了适当扩充，提出了适合于多agent团队的一种共享经验元组的多agent协同强化学习算法。其中采用新的状态行为的知识表示方法，采用相似性变换和经验元组的共享，能够提高多agent团队协同工作的效率。最后将该算法应用于猎人捕物问题域，实验结果表明该算法能够明显加快多个猎人合作抓捕猎物的进程。

其他文献

Stathmin在非小细胞肺癌组织中的表达及意义

目的探讨Stathmin在非小细胞肺癌发生、发展中的作用。方法采用RT—PCR法检测50份非小细胞肺癌组织及相应癌旁组织、正常肺组织标本中Stathmin的表达情况，分析Stathmin表达与

期刊

STATHMIN蛋白癌非小细胞肺

微型化学实验在《大学化学实验》教学体系改革中的探索

在《大学化学实验》中引入12个微型化学实验，使大学化学实验在整体改革中显示出独特的魅力，微型化学实验贯穿在基础部分、结合部分、应用与开放部分，使课程在方法与手段上新颖化

期刊

大学化学实验微型实验体系改革

烟雾病的研究进展

烟雾病（Moyamoya disease，MMD）于1957年由Takeuchi和Shimizui首次描述，以双侧颈内动脉末端和大脑前、中动脉近端狭窄或闭塞为特点，有时也累及大脑后动脉^[1]。该病因伴随脑底异常

期刊

烟雾病脑血管疾病缺血性中风短暂性脑缺血发作血管重建

胸膜血管肉瘤1例报告

患者女，63岁。因右侧胸痛2周，喘憋3d于2012年2月8日入院。既往有高血压病史。查体：体温36．8℃脉搏114次／min，呼吸23次／rain，血压133／89mmHg，喘憋貌，口唇发绀，被迫坐位，右下肺叩诊浊音，听诊

期刊

血管肉瘤高血压病史胸膜肺呼吸音右侧胸痛右下肺湿罗音反跳痛

多agent协同强化学习算法SE—MACOL及其应用

与本文相关的学术论文