论文部分内容阅读
囚徒困境博弈是研究动物以及人类社会中合作行为的最常用的博弈论模型,它的纳什均衡只有一个,就是所有参与人都选择背叛。然而在现实中,合作行为是无处不在的。对这一分歧的一个直接解释就是在现实中动物以及人们的交往都是重复进行而非只是一次。对个体在重复进行的博弈中的合作行为,研究者通常是从两个角度予以分析,一是从理性人个体微观决策角度展开的重复博弈研究,另一个是从种群宏观演化角度展开的演化博弈研究。 从理性人微观决策角度出发,由于人们在每次博弈中做决策的时候需要考虑当前决策对将来结果的影响,因而能够与对手达成对双方最优的长期合作局面。以往关于重复博弈的研究大部分假设参与人在重复博弈中的地位是对等的。在这些研究中,虽然重复博弈本身是动态的博弈过程,但是博弈的形式仍然是标准形式的博弈。现实中存在大量的例子表明,人们在博弈中的地位是非对称的。本文研究了Stackleberg形式的重复囚徒困境博弈。在研究中,一名参与人(先行者)先制定自己在重复博弈中的策略并将该策略公布给另一名参与人(跟随者),跟随者然后再制定重复博弈中的策略。研究了该博弈的子博弈精炼纳什均衡以及均衡下两名参与人的策略和收益,主要的发现有:在平均收益下,博弈存在唯一的子博弈精炼纳什均衡收益;在该均衡收益下,先行者具有绝对优势,他的收益是所有理性结果中的最大收益,而跟随者只能获得理性收益水平,也就是两个人都背叛时的收益;存在一类简单的策略是先行者的均衡策略,这些策略是一步记忆的平稳策略,我们称之为“邪恶策略”;在所有的子博弈精炼纳什均衡策略中,对于先行者而言,邪恶策略恰恰是其全部一步记忆的均衡策略;邪恶策略与最近发现的零行列式策略有紧密的联系,两者的交集总是非空的,而且交集恰恰位于邪恶策略的边界上。 从种群宏观演化角度研究哪些演化机制能够促进合作行为的涌现是演化博弈论的主要研究问题之一。由于背叛是囚徒困境博弈中唯一的纳什均衡,因此合作涌现离不开特定的演化条件。最近的研究表明条件分离机制也能够促进合作的涌现和稳定。然而,在这些研究中,个体的策略总是被限定为纯策略,这在现实中是很难实现的。此外,在这些研究中,条件分离机制往往与别的已知能够促进合作演化的机制混合在一起,这就无法让人们对条件分离机制的真实作用有清晰的认识。在我们的文章中,研究了一个非常单纯的模型,在避免了其他可能对演化结果有影响的机制的同时,对混合策略也能够进行分析讨论。我们发现,不论种群的策略空间是纯策略还是混合策略,条件分离机制都能通过提升种群内的正向搭配水平的方式够促进合作的演化。因而支撑了条件分离机制本身即可促进合作演化的论断。然而,与只允许个体采取纯策略相比,允许个体采取混合策略会抑制合作的水平。通过计算机仿真和对演化稳定策略的理论分析发现,种群演化的最终策略大致可以分为两类,一类是合作者但是对背叛行为的容忍度有限,另一类是背叛者同时对背叛行为完全容忍。还考虑了建立伙伴关系所需要的时间成本问题,这在我们的模型里通过等待时间来描述,这种等待可以看作是对个体的一种惩罚。我们发现,合作水平会随着惩罚的加重,即等待时间的变长,而得到提升,但是随着等待时间继续变长,合作水平会稳定下来。