多agent协同强化学习算法SE—MACOL及其应用

来源 :广西师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:guozhi1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多agent团队中各成员之间是协作关系且自主决策的学习模型,在此对Q学习算法进行了适当扩充,提出了适合于多agent团队的一种共享经验元组的多agent协同强化学习算法。其中采用新的状态行为的知识表示方法,采用相似性变换和经验元组的共享,能够提高多agent团队协同工作的效率。最后将该算法应用于猎人捕物问题域,实验结果表明该算法能够明显加快多个猎人合作抓捕猎物的进程。
其他文献
目的探讨Stathmin在非小细胞肺癌发生、发展中的作用。方法采用RT—PCR法检测50份非小细胞肺癌组织及相应癌旁组织、正常肺组织标本中Stathmin的表达情况,分析Stathmin表达与
在《大学化学实验》中引入12个微型化学实验,使大学化学实验在整体改革中显示出独特的魅力,微型化学实验贯穿在基础部分、结合部分、应用与开放部分,使课程在方法与手段上新颖化
烟雾病(Moyamoya disease,MMD)于1957年由Takeuchi和Shimizui首次描述,以双侧颈内动脉末端和大脑前、中动脉近端狭窄或闭塞为特点,有时也累及大脑后动脉^[1]。该病因伴随脑底异常
患者女,63岁。因右侧胸痛2周,喘憋3d于2012年2月8日入院。既往有高血压病史。查体:体温36.8℃脉搏114次/min,呼吸23次/rain,血压133/89mmHg,喘憋貌,口唇发绀,被迫坐位,右下肺叩诊浊音,听诊