论文部分内容阅读
联盟是多Agent系统中的一种经典组织形式,Agent间通过形成联盟达到提高任务求解能力、获取更多收益的目的。随着计算机技术的发展和应用环境的变化,联盟所面对的任务往往处于动态环境之下,需要Agent间进行分布式的协作,并且对联盟完成任务过程中所消耗的代价存在一定的限制。所有这些变化都要求联盟进行一定的改进,以提高联盟的性能。在多Agent系统组织和任务分配研究领域的发展为联盟的改进提供了相应的支持。 本文主要关注联盟模型的改进和联盟形成阶段的改进,并且在捕食者问题场景下展开研究,本文主要工作如下: 1)综述了Agent及多Agent系统的定义、分类、结构以及联盟和强化学习等相关背景知识。 2)分析了联盟模型形式化的研究现状和存在的问题,基于ARG元模型提出了一种采用角色和学习机制的新联盟模型:CLAR联盟模型。CLAR联盟模型利用角色更好的描述协作性任务,利用学习机制更好的适应动态环境,并通过实验验证了角色和学习机制在捕食者问题中的作用。 3)分析了联盟形成的研究现状和存在的问题,在采用合同网协议的CLAR联盟模型中提出两阶段联盟形成机制。两阶段联盟形成机制利用第一阶段的候选联盟成员分析控制了联盟形成阶段的交互规模。最后通过捕食者问题实验验证了两阶段联盟形成机制在减少和控制通讯代价上所起的作用。 4)开发了一个界面友好和功能丰富的捕食者问题仿真实验平台,为更直观和方便的研究捕食者问题提供了支持。