论文部分内容阅读
针对带有时间约束的、可以动态加入到环境中的复杂任务,建立了一种基于对策论的任务协作模型,该模型至少存在一个纯策略Nash平衡解.给出了一种任务协作方法,该方法中Agent能够根据自身的局部信息进行行为选择,并利用虚拟行动学习方法确保Agent快速学习到一个纯策略Nash平衡,仿真实验结果表明该方法与Chapman和刘的方法同等有效.