论文部分内容阅读
合作广泛存在于自然界和人类社会中。然而,合作意味着个体需要牺牲自身的利益,此时自私的个体通过背叛行为剥削合作者的利益使其获得更高的利益,这将使得合作者在自然选择的过程中处于不利的地位。如何解释合作的涌现成为困扰科学家们的一个难题。从传统经典的非合作博弈理论看来,完全理性的个体会选择背叛这一严格占优的策略,合作将不可能产生。该理论是以参与人的个体完全理性为前提假设,每个参与人都是以追求自身利益最大化为原则进行决策,且这一决策准则对于所有的参与人来说是共同知识。在这样的前提假设下,每个参与人在事先给定的博弈结构和博弈环境下会准确地做出决策。然而在现实中,参与人在高度不确定和极其复杂的博弈决策环境中,人的知识、想象力和计算力是有限的,参与人很难对博弈具有完美的预测和决策能力从而做出完全理性的决策。综合考虑到上述这些因素,这使得参与人很难真正进行完全理性的决策,在进行决策时往往会考虑到自身过去的经验、行为习惯以及他人类似情形的决策行为。于是人们提出了有限理性的概念,并构建了演化博弈理论。在个体有限理性的假设条件下,参与人不再做出完全理性的最优决策,人们在多次的博弈中通过学习不断调整自身的策略。演化博弈理论对于社会困境如囚徒困境与公共物品博弈等问题中合作的涌现做出了很好的解释,逐渐成为研究社会困境下合作涌现问题的重要理论工具。本文系统地介绍了演化博弈中相关促合作问题的理论知识,主要包括复杂网络理论、“绿胡须效应”理论、自愿参与机制、社会困境下的惩罚以及随机博弈,对基于上述理论的社会困境合作问题研究进行了梳理。本文基于上述理论对社会困境下的合作问题做了进一步的研究,主要包括以下四个方面:首先,我们受到智能优化算法的启发,在演化博弈中构建了基于粒子群优化算法的策略更新规则。在该策略更新规则下,每个参与人将根据自身历史的最优策略以及邻居当前的最优策略进行权衡来更新自身的策略。我们首先研究了规则网络结构种群下囚徒困境与雪堆博弈的合作演化,研究表明该策略更新规则可以有效地促进合作,即使在合作成本很高的不利情形下,种群仍然会维持一定的合作水平。同时,在雪堆博弈中该更新规则在合作成本较高的情形下抵消了空间结构对合作的抑制使得种群的合作水平高于混合纳什均衡,合作者在该策略更新规则下同样会产生聚集。较低的模仿权衡系数使得个体倾向于采取完全合作和完全背叛两种策略并促使完全合作的个体聚集,较高的模仿权衡系数使得种群呈现多样化的合作水平且完全合作个体无法聚集。我们进一步研究了参与人获得度平均收益时BA无标度网络上的囚徒困境,构建连续策略和混合策略两种策略情形下的粒子群优化策略更新规则。研究结果表明,在连续策略情形下该策略更新规则可以明显提高种群合作水平,而在混合策略情形下该策略更新规则会使得种群的合作水平急剧降低并造成合作的崩塌,度较低以及度适中的节点对合作的演化起着重要的作用。然后,考虑个体具有可识别的标签且其策略空间包含无条件合作、无条件背叛、组内合作以及组间合作四种策略的情形,研究了“绿胡须效应”对粒子群优化策略更新规则下种群合作演化的影响。此时,个体将根据自身及对手的标签和策略类型来决定是否采取合作。研究表明,较低的模仿权衡系数会使得相同策略类型的个体聚集。当个体仅具有策略更新能力而不具有繁殖能力时,组内合作与组间合作两种策略并无明显差异。当个体同时具有策略更新与繁殖能力时,在较小的模仿权衡系数以及合作成本下个体繁殖能力的引入使得组内合作迅速占领整个种群。个体后代的迁移能力越高越有利于组间合作在种群中的维持。再次,研究了分担惩罚成本的公共物品博弈下合作的演化。在该模型中,合作者不仅对公共物品进行投资还要对背叛者进行惩罚,惩罚的成本将由合作者们共同分担。首先,研究了无限种群下合作的演化,研究表明该惩罚的引入有利于合作的演化并促使合作成为唯一的演化稳定策略。然后,研究了规则网络下的有限种群,研究结果表明,网络结构的引入促使合作在更小的罚金阈值下得以在种群中存活,此时合作与背叛策略共存的内部均衡点成为演化稳定均衡。然而当罚金较大时,在均匀混合的种群中合作反而具有更大的吸引域,这表明网络结构与惩罚的共同作用对合作并不总是起到促进作用。最后,我们引入了自愿参与机制,研究表明不参与策略的引入使得背叛不再成为演化稳定策略,这一策略的引入使得合作策略可以在更低的罚金阈值下成为唯一的演化稳定策略,这表明不参与策略的引入确实在一定程度上具有促进合作的作用。最后,我们研究了随机博弈下社会困境的合作演化。之前的研究往往假设博弈的收益矩阵是固定,而在现实中随着博弈的进行博弈的收益矩阵状态会依赖于双方的历史行动而发生随机转移。因此,我们建立了规则网络结构下基于博弈收益矩阵状态发生随机转移情形的随机囚徒困境与随机公共物品博弈模型。研究结果表明,在随机囚徒困境博弈中,当两种博弈状态下合作带来的收益差值小于合作成本时,博弈状态的随机转移会使得种群的合作水平降低,博弈状态随机转移到高收益博弈状态条件越严苛将越不利于合作。当两种博弈状态下合作带来的收益差值大于合作成本时,博弈状态的随机变化会促使种群的合作水平提高。证实了总是合作(ALLC)和“以牙还牙”(TFT)策略相较于“赢保持,输改变”(WSLS)策略而言对促进种群合作更加具有优势。在随机公共物品博弈中,博弈状态的随机变化同样会使得种群的合作水平降低。博弈状态转移到高收益博弈状态条件越严苛对于种群合作的维持越不利,甚至导致种群合作的崩塌。在随机公共物品博弈中“赢保持,输改变”(WSLS)策略对于种群合作的维持具有明显的优势。