论文部分内容阅读
合作在当今社会中扮演着越来越重要的角色,小到生物体内细胞间的分工协作,大到学校企业各部门的职能搭配,甚至国家与国家之间的外交与贸易,都与合作密不可分。研究合作行为不仅可以帮助我们更好地理解复杂系统中的繁杂现象,构建和谐有序的社会环境,而且有助于促进多智能体间的协同运作,提升系统的整体性能。博弈论为研究竞争环境下的合作提供了统一的理论框架。传统博弈理论认为博弈各方的收益需由所有参与者共同决定,然而近年提出的零行列式策略可以在重复囚徒困境博弈中单方面限定博弈双方的期望收益关系,为博弈论研究提供了崭新的视角。敲诈策略和慷慨策略是两类重要的零行列式策略子集:敲诈策略可以单方面保证自己的收益不低于对手,而慷慨策略是敲诈策略的对偶策略,可以单方面保证自己的收益不高于对手。这两类策略引起了学者们的特别关注。现实中的许多复杂系统,如生物系统、社会系统和互联网等都可以用复杂网络进行刻画。网络演化博弈理论结合复杂网络和演化博弈理论,致力于研究在复杂场景下多个体间的博弈及演化动力学,为理解真实系统中的群体合作行为提供了理论工具。除了理论研究以外,真人博弈实验是博弈论的另一重要研究范式。通过开展实验,一方面可以对博弈理论进行验证,另一方面也可以挖掘个体的真实行为规律,为理论研究提供支持。本文基于零行列式策略理论,分别从网络演化博弈理论和人机博弈实验两个方面,对群体的合作演化机理与个体的博弈行为特性展开研究。主要包括以下内容:首先,本文研究了敲诈策略在规则网络上的演化轨迹以及其对合作演化的影响。在重复囚徒困境博弈模型和复制动力学更新机制下,本文通过数值仿真和点对近似模拟研究了合作、背叛与敲诈策略在规则网络上的博弈与演化。结果表明敲诈策略在规则网络上可以与合作策略形成稳定的联盟结构,从而抵御背叛策略的入侵,并最终消灭背叛策略,极大地促进合作的涌现。接着,本文基于费米函数规则研究发现,个体有限理性程度对敲诈策略与合作策略的演化存在非单调的作用。规则网络是经典的网络模型,该研究有助于为更复杂结构上的网络博弈研究提供基准,具有重要的理论价值。其次,本文基于重复囚徒困境模型与复制动力学更新机制,研究了敲诈策略在无标度网络上的演化。首先通过数值仿真研究了无标度网络上合作、背叛和敲诈策略的博弈与演化,发现敲诈策略可以帮助合作策略在网络上从小度叶子节点扩散到大度中心节点,形成一种“自底向上”的扩散路径。随后进一步研究了网络度相关性对演化的影响,发现在拥有同配特性的无标度网络上,敲诈策略可以促进不同策略在网络中的重新分配,帮助合作策略占据大度节点,并避免被背叛策略入侵。但网络的同配特性反过来也抑制了合作策略的进一步扩散。已有研究表明,满足幂律度分布的无标度网络模型能有效刻画真实系统的拓扑结构特性,该研究为理解真实网络上的合作涌现提供了新的思路。再次,本文研究了引入博弈交互与策略学习之间的时间尺度多样性之后,敲诈策略在网络上的演化。在模仿动力学机制下,网络演化博弈中存在两层网络:博弈交互网络与策略学习网络。过去网络博弈研究通常假设这两层网络拥有一致的时间尺度,然而在现实中这者并非总是一致的。本文通过引入一个多样性因子对这种不一致性进行量化,发现在规则网络上加入一定的时间尺度多样性,可以帮助博弈个体在获得高收益之后降低更新速率,从而有效地促进了合作策略与敲诈策略形成稳定的联盟结构,提高了整体的收益。虽然在无标度网络上敲诈策略无法与合作策略稳定共存,但引入时间尺度多样性同样可以促进合作策略与敲诈策略的接触,帮助合作行为在网络中扩散,从而提升网络中的合作比例。该结论有助于进一步理解真实场景下的策略演化机制。最后,本文通过开展基于零行列式策略的人机博弈实验,对个体行为特性进行实证研究。通过控制被试与不同零行列式策略博弈以及告知被试其博弈对手的不同性质这两个重要变量,研究了人类被试在博弈实验中的合作行为。结果表明,不同零行列式策略对被试的合作行为存在不同的影响,并且告知被试其对手的不同性质可以调节这两种影响的差异程度。特别地,明确告知被试其对手为计算机程序,一方面可以有效地消除敲诈策略对合作行为的抑制作用,另一方面也会减弱慷慨策略对合作行为的促进作用。此外,本文进一步研究了人类被试的决策时间特性。结果表明,在重复博弈实验中人类的决策时间存在明显的异质性,其频率分布具有长尾现象,尾部可以由幂律分布近似拟合。这些结论为研究个体的合作规律以及与决策时间相关的行为分析提供了重要的参考。