论文部分内容阅读
最后通牒博弈是有两名博弈者的非零和动态博弈,重复进行该博弈类似于讨价还价。通过模型化该博弈,对博弈中个体产生的行为、策略以及公平的演化研究非常具有现实意义。演化博弈动力学是对博弈论的种群进化动力学方法的应用,它被演化生物学家引入,通过古典博弈论进行预测。本文通过演化博弈方法对最后通牒博弈中的行为策略进行研究。本文首先介绍了无限种群的确定性演化动力学以及有限种群的随机性演化动力学理论,并给出了最后通牒博弈的一般模型、均衡,和博弈演化下的合作与有偏好的行为定义。接着,给出了最后通牒博弈的演化动力学描述经典模型。对于无限种群,给出了复制方程和自适应方程的确定性的动力学描述。其中复制动态方程描述下的一种模型表明理性策略一定条件下最终会占优公平策略。自适应动态方程描述下的单参数模型表明,自然选择特征为公平,最终得到公平解,而双参数模型表明,自然选择特征为不公平,最终得到理性解。对于有限种群,给出了基于Moran过程以及基于Fermi过程的两种典型的随机性的动力学描述。其中,基于Moran过程的选择演化过程,表明尽管没有重复的相互作用或者信誉机制,最后通牒利他策略在适合度方面比贪婪的策略更有优势。最后,本文创新地给出了最后通牒博弈在有限种群中的一种新策略研究方法。通过引入新的调整策略机制,给出博弈者行为贪婪偏好与利他偏好的定义并将其量化,分别在单一策略模型与多策略模型中研究行为偏好程度对最后通牒博弈合作与适合度的演化带来的影响。结果表明,单一策略模型中,利他偏好的种群将更容易演化出合作,从而间接互惠获得更高的适合度。贪婪偏好的种群将会倾向于不合作,最终种群整体的适合度相对较低。在整体行为无偏时,出现了跳水现象。同时所有单一策略的种群将会演化出五种不同的社会财富结构,包括金字塔结构、倒金字塔结构、哑铃结构、双峰结构以及橄榄型结构。在无学习的多策略模型中,利他偏好的个体仍然比贪婪偏好的个体更容易出现合作,且利他程度越高,合作可能性越大,在整体行为无偏时,跳水现象消失;但是种群的贪婪程度越高适合度越高,即多策略模型中,贪婪偏好个体比利他偏好的个体占优。当在多策略模型中引入Fermi学习,在足够的时间步下种群出现策略侵占。Fermi学习过程是挑选优秀策略的一种常见机制,在该学习过程中,却出现利他策略留存,同时这与基于Moran过程的最后通牒博弈的结果一定程度上是呼应的。