【摘 要】
:
在多Agent系统中,由于环境是动态变化的,其它Agent的行为是未知的,所以多Agent系统及系统中的每个Agent应当具备学习或自适应能力。强化学习作为一种无需要环境模型的机器学
论文部分内容阅读
在多Agent系统中,由于环境是动态变化的,其它Agent的行为是未知的,所以多Agent系统及系统中的每个Agent应当具备学习或自适应能力。强化学习作为一种无需要环境模型的机器学习方法,现已成为多Agent系统的研究热点。与此同时,由于单个Agent的资源和能力的有限性,需要多个Agent之间的协作来共同完成任务。本文的主要研究工作包括以下几个方面:(1)论文首先介绍了Agent和多Agent系统的研究基础,然后分别围绕多Agent学习方法、多Agent协作机制和强化学习三个方面简要阐述了多Agent协作学习的基础知识。(2)将预测加速抉择机制、黑板模型、融和算法以及强化学习技术相结合,提出了一种改进的多智能体协作学习方法及其模型。其中,黑板是一块共享的存储区域,可以实现信息共享;融和算法用来对信息进行融和;强化学习技术利用融和结果进行动作选择。(3)追捕问题是一个多Agent系统,同时存在多Agent之间的协作与竞争,被广泛用来测试人工智能领域的学习算法。本文利用追捕问题对改进的多智能体协作学习方法进行实例分析与仿真验证。实验结果表明,该方法能够有效地提高多Agent系统中Agent的协作学习能力。
其他文献
大学校园流行语是一种词汇现象,也是一种文化现象。本文通过收集和分析一些大学校园流行语语料,阐述了大学校园流行语的特征及其规范的问题。
应用仿真软件建立某型坦克抢救车液压系统的模型,详述三路阀等车辆专用阀的建模。在此模型基础上,仿真研究典型故障情况下的液压系统动态特性,得出故障的特征信息,为故障诊断提供
随着中国工业设计的发展,工业产品对人性化需求越来越高,现阶段的显控台亟待在造型上进行人体工效学的再设计。在显控台产品设计中要加入更多的人性化设计,需要探索显控台的
目的:探讨B超引导下麦默通微创旋切系统治疗乳腺良性肿瘤的护理体会。方法:收治患者103例,术前完善相关检查,做好心理护理,指导注意事项;术中与患者沟通,分散注意力;术后严密观
随着高中英语课程改革的不断推进,高中英语教师应积极探索同课程改革同步进行的高中英语教学方法,重构英语课堂教学模式,从而保证英语教学的实用性和时代性。本文对核心素养
随着Internet的普及,电子商务也成为当下的主流,每天Internet上的信息更新量呈指数级增长,导致出现“信息过载”的现象,浩瀚的信息中有99%的信息是用户不需要的。用户难以在海量
本论文以新型的大孔SiO2材料为载体,利用其结构导向作用和毛细管效应,制备出大孔径的C/SiO2复合材料。在此材料的基础上采用原位水解、高温重结晶的方法,制备得到了C/SiO2/SnO2
中国电信业从上世纪90年代后期至今,经过近十年的电信体制改革与发展,取得了令人瞩目的业绩,截至2010年11月底,电话用户11.48亿户,互联网宽带用户达到12488.9万户。电信业务
本文研究了ATO/SiO2大孔电极的制备及其电氧化性能,以本课题组前人制备的SiO2大孔材料为载体,完成了ATO/SiO2大孔电极材料的制备、表征,利用该电极开展了电氧化降解有机物和水溶
大黄鱼(Pseudosciaena crocea)应激能力差,遭受台风侵袭时,海区网箱内水体激烈动荡,会引起养殖大黄鱼应激反应而大量死亡,渔业损失严重。为了防灾和减少灾后损失,2009年7月,进行了大