论文部分内容阅读
自人类社会产生开始,合作问题就一直是影响人类发展的重大问题。个体都是在自利的动机下采取行动,共同利益并非个体行为的直接原因,理性的合作不一定必然出现。这引发了关于合作是如何在由自私个体组成的群体中产生以及演化这一问题的研究。博弈论为研究个体之间的合作关系形成提供了有力的理论框架。目前在合作演化问题研究领域,学界提出了包括直接互惠与空间互惠在内的五种促进合作的机制,并且围绕着信誉、迁移、教育活动等诸多机制展开研究。但迄今人们对于群体合作行为的演化机制、影响合作的环境因素以及基于个体迁移机制的动态交互关系下合作的涌现机理的认识还有待进一步深化与拓展。因此,本文从个体的博弈策略研究与个体迁移机制研究入手,采用基于Agent建模的计算机仿真实验方法,从宏观现象与微观分析两个层面对以上问题展开深入探究,针对均匀混合群体、静态交互网络、动态交互网络三种问题情境,分别从博弈策略、策略更新机制、个体迁移机制提出了相应的促进合作涌现的机制,并对这些情境下涉及到的影响合作策略演化的因素进行了探究。首先,本文聚焦均匀混合群体下有噪音的重复囚徒困境博弈。本文提出了一种灵活互惠利他策略(FRAM),在该策略下博弈者对于对手的背叛行为会保持一定程度的容忍,并能够为了长期回报而继续采取合作的策略,持该策略的个体,其决策基于与对手长期交互的历史,噪音带来的意外影响不会立即打破两个参与者之间的长期合作关系。本文采用生态演化模拟实验的方法发现FRAM和CTFT策略的抗噪性能更强,而TFT策略在低噪音环境中容易胜出;此外个体间交互频次越高越有利于合作的策略,交互频次降低的过程中,合作策略逐渐失去优势,当交互频次小于3时,博弈等同于单次博弈,背叛策略成为最优策略。本文研究表明,基于个体长期记忆的策略抗噪能力强,在个体交互频繁的环境中表现出更大的优势,同时也说明环境对博弈策略演化的影响是巨大的。其次,本文聚焦静态网络博弈情境,针对现有的策略更新机制大多采用取代机制这一问题,提出了基于相邻个体收益差的渐进策略学习机制,假定个体策略为完全背叛策略到完全合作策略之间的连续值,个体在执行策略学习时,策略变化的程度基于自身与学习对象间的收益差值,学习对象的收益相比于该个体差异越大,策略调整的幅度则越大,个体对差异的敏感程度会影响策略调整。研究发现当个体对收益差的敏感程度较小且个体获知邻居收益信息的数量较少时,相比于取代机制,本文提出的机制能够使系统合作水平大幅度提高,原因在于合作者与背叛者间会形成策略居中隔离带,使合作者簇很难被背叛者入侵。本文研究表明渐进机制相比于取代机制演化更加稳定,抗随机性更强,特别是在背叛诱惑较大的情况下,依然可以促使系统涌现出合作行为。之后,本文聚焦动态交互关系下的合作演化问题,提出了基于个体演化偏好的策略模仿与位置迁移的协同演化机制,为了体现个体对邻居收益信息的掌握程度,引入了策略模仿收益依赖参数,为了体现移动目标空位信息从无到有,引入了迁移空位信息噪音参数。通过平面二维网络上的仿真研究发现,当个体所掌握的邻居收益信息精度居中且迁移空位信息精度较高时,较大的策略模仿偏好或者较大的迁移偏好都可以实现合作的爆发式扩张;居中的无倾向的演化方式不利于合作。本文揭示了在迁移机制的作用下,个体不但可以通过传统的以策略模仿为中心配以少量移动的方式来促进合作,还可以通过以迁移为中心配以缓慢模仿的方式来实现合作的涌现。研究结果同时表明在种群密度较低的环境下后者更加有利于合作。最后,本文聚焦动态交互关系下的趋利移动带来的局部背叛者团簇问题,针对这一问题提出了两种混合移动机制:趋利移动与逃离移动的混合移动机制(PDMMP),趋利移动与全局平均收益驱动的混合移动机制(PDME)。并且将这两种机制与混合了随机移动的趋利移动机制(PDMR)作比较。通过实验发现,当群体密度较大时,趋利移动促进合作的效果更为显著,此时混入少量的其它移动机制(随机、平均收益驱动、逃离)可以大幅度促进合作;当群体密度较小时,在趋利移动中混入高比例的逃离移动以及中比例的平均收益驱动移动则更加有利于合作。混合迁移机制PDMMP和PDME对合作的促进作用都显著优于PDMR;PDMR机制下,如果混入的随机移动的比例超过一定阈值,则对合作起抑制作用。本文揭示出趋利移动与其他移动方式的混合移动机制更够抑制局部背叛者团簇的出现,从而进一步促进合作的传播与扩散。