论文部分内容阅读
摘要:自组织系统中理性或自私个体如何展开合作是个有意义的问题。大量研究表明,亲缘关系,网络结构,群体选择,声誉系统等都能帮助理性群体中涌现合作行为。演化博弈理论为这一问题提供了理论模型。本文针对3种主要的困境博弈:囚徒博弈、雪堆博弈和猎鹿博弈,创立了基于“合作比率——系统收益——R、ST、P互惠分布——策略分布”这样的一个完整的分析链,能够清晰的看到系统的运行和演化情况,加深了对合作机制的理解。主要内容和研究成果如下:(1)演化困境博弈系统中记忆对于合作水平的影响的研究。研究发现具有记忆的系统不一定比没有记忆的系统演化出更高的合作水平。我们探讨了通过数学的方法对全连接网络下的具有记忆的系统进行分析的困难性。记忆能力对于不同的困境系统的合作演化具有不同的影响:记忆对于囚徒博弈系统的合作具有非常强的促进作用;记忆大部分情况下能够促进猎鹿博弈系统的合作;而记忆对于雪堆博弈系统的合作的影响包含2种情况,当背叛诱惑较小时,记忆抑制了合作水平,当背叛诱惑较大时,记忆能够帮助系统克服诱惑,促进合作。研究发现,在雪堆博弈中,记忆虽然部分地抑制了合作,但是实际是促进了ST互惠,所以虽然合作水平下降,但是系统收益水平上升了研究同时发现WSLS(赢存输去)策略能够在囚徒博弈,雪堆博弈和猎鹿博弈中广泛存在。(2)上一代的历史对于下一代合作演化影响的研究。我们研究了每一代的初始历史对于合作的影响,发现每一代如果记忆上一代的博弈历史,系统的表现不会比随机初始化历史更好。进一步来说,对于无条件模仿(unconditional imitation)策略更新规则,对于囚徒博弈,雪堆博弈和猎鹿博弈,记忆历史反而抑制了合作,使得系统合作水平远远低于随机初始化每一代初始历史的情况;对于复制子(replicator)策略更新规则,记忆历史表现类似于以50%的合作比随机初始化每一代初始历史的情况。不同的初始合作比率在复制子规则的系统中对最终合作水平影响很大,高的初始合作比可以导致高的最终系统合作水平;而在无条件模仿规则中,不同初始合作水平影响不大。这些现象的根本原因在于随机的初始化破坏了背叛策略形成的一些结构。(3)ST互惠中的轮换合作机制的研究。我们构建了一个扩展的ST平面,通过对不同长度的记忆能力系统的演化,发现当记忆长度大于等于2时,轮换合作(CAD)在S+T>2R的平面上广泛涌现,而另外一种ST互惠—持续策略(DorC)则在S=T所在的直线上面存在。同时,也研究了不同记忆长度在扩展的ST平面上对合作水平,系统收益水平的影响。运用统计6步博弈历史对稳定后的演化系统策略进行了分析,能够验证轮换策略和持续策略的分布情况。(4)具有记忆的agent随机移动对于合作产生的影响的研究。研究发现对于COD移动模式(博弈-更新-移动)规则,低速的移动对于囚徒博弈,雪堆博弈和猎鹿博弈都能促进合作;而高速的移动抑制了合作;对于CDO移动模式(博弈-移动-更新)规则,有趣的是,高速的移动反而促进了合作。移动对于雪堆博弈中的ST互惠有一定的促进作用。记忆在COD模式中促进了合作,而在CDO模式中,对于合作的影响比较复杂。