论文部分内容阅读
演化博弈是从生物学中的Moran过程发展出来的,它为解释合作是如何产生和维持的这个问题提供了新的思路和研究工具,因此其作为一个重要的数学模型被广泛应用于各种社会经济问题的研究中。演化博弈在继承博弈论基本思想的前提下,不断拓展了新的研究范畴,其中主要的研究内容包括四个:博弈模型、种群结构、策略更新规则和对演化结果的评估方法。研究博弈模型可以帮助我们了解种群中个体参与博弈的情况以及相应的博弈特性与方式,同时根据社会发展中新的博弈现象建立新的研究模型。种群结构分为有限种群和无限种群,不同的种群结构将导致个体相遇和发生博弈情况的差异,例如对于无限混合均匀种群而言,种群中的个体随机相遇,而有限结构化种群中个体只能与邻近个体相遇发生博弈,因此可以通过研究种群结构来了解个体相互作用行为。策略更新规则是指参与博弈的个体在得到博弈收益之后根据一定的规则进行策略更新,目前主要采用的规则包括适应度规则、愿景规则和模仿规则以及它们之间的组合,不同的策略更新规则将导致不同的演化动态。对演化结果的评估方法主要包括两种,扎根概率和平均丰度。本文主要研究在有限种群中多人博弈(以三种经典的多人社会困境博弈模型为背景)在愿景演化动态(简称愿景规则)的演化模型,本文研究与其它演化博弈的研究有如下两方面的差异:一是本文主要关注有限种群中的多人博弈而不是二人对称博弈;二是本文主要关注不同多人博弈在愿景演化动态规则下演化博弈的平均丰度而不是扎根概率。平均丰度函数是评判演化博弈结果的有效工具之一。它刻画了在演化结果中种群中采取某种类型的个体的平均数量。因此,它具有统计学意义,便于对评判结果的理解和认识,特别适用于多人博弈演化结果的分析。以多人雪堆博弈、线性公共物品博弈、阈值公共物品博弈的演化博弈模型作为研究背景,在愿景规则驱动下对无突变和有突变的情况,从理论和仿真两个方面对这三个演化博弈模型的平均丰度函数的表示及特征进行了较系统的研究。首先,对多人演化博弈的行为进行了讨论,分析了相应的收益矩阵,运用概率论与数理统计,揭示了收益函数本质上可表示为收益矩阵阵元与相应抽取概率的乘积的加权和,从而得到了收益函数的通用表达式。基于收益函数的通用表达式和结合三个经典博弈模型,采用数理分析方法具体给出了了雪堆博弈、线性公共物品博弈、阈值公共物品博弈收益函数的数学表达式,通过该表达式可以直观和定量分析平均丰度函数与相应参数的关系,为我们进一步深入研究平均丰度函数提供了理论基础,另外,根据收益函数的表达式绘制了收益函数随演化状态i变化的曲线,从而更直观揭示了相应参数对收益函数的影响以及更深入解释了收益函数随i变化的趋势。通过对收益函数的运算分析可以进一步掌握其渐进特性以及不同策略之间收益函数的相对大小关系,为后续分析奠定基础。基于平均丰度函数的定义,在传统研究的基础上,结合细节平衡公式得到出了基于愿景规则、用有明确直观意义的函数h(i,ω)给出了多人演化博弈模型的平均丰度函数的直观表达式,该表达式通过h(i,ω)函数与相关参数经多种复合运算构成平均丰度函数。其二,对前述三个多人演化博弈模型的平均丰度函数的基本特性进行了较深入的研究。在弱选择强度情况下分别对无突变和有突变两种情况给出了平均丰度函数一阶泰勒展开式的表达式,并利用一阶泰勒展开式对平均丰度函数的仿真结果进行了定量分析,拓展了一阶泰勒展开式的应用范围。针对强选择强度的情况,采用截断分析方法证明了在不占优的情况下(A策略个体占比小于1/2)平均丰度函数关于全种群N的求和可以简化为对部分种群的求和。在此基础上,根据不同策略的收益函数之差在i(选取A策略个体数量,即演化状态)足够大时趋于定值的特点对于截断近似公式的适用范围进行了讨论,进而给出了三个模型中使得截断近似效果显著的参数范围。进一步,对于多人线性公共物品演化博弈模型得出了倍增系数的限定范围。而对于多人阈值公共物品演化博弈模型的研究表明阈值m与i必须共同满足相应不等式,并通过相应数学计算得出了阈值m与i的限定范围。通过数值计算验证和进一步分析了截断近似理论。把平均丰度函数看成多参数的函数进行了参数变化影响的仿真分析。由于不仅各参数之间关系复杂而且参数中包含连续变量和离散变量,因此将数据仿真用于分析多参数对于有限混合均匀种群的基于愿景规则的平均丰度函数的影响。结合多人雪堆博弈模型、线性公共物品博弈模型和阈值公共物品博弈模型重点仿真计算和分析了组规模、愿景水平、成本等参数在不同的选择强度情况下对平均丰度函数的影响。得到了一些具有规律性的结论,从定性和定量两方面揭示了平均丰度函数与相关参数之间的关系。将多人雪堆演化博弈模型应用于环境污染管控决策问题中,并在研究中对传统模型进行了新的改进使其更接近实际情况。其三,分析了愿景规则和突变共同作用下的多人演化博弈行为,给出了具有突变特性的平均丰度函数的直观表达式。采用幂级数展开的方式对具有突变特性的平均丰度函数进行近似分析。基于三个多人演化博弈模型的收益函数π(i)和h(i,ω)函数的不同特征,给出了不同多人演化博弈模型对应的平均丰度函数的近似式及其选择强度的适用范围。对多人雪堆演化博弈模型,分别对选择强度较小和较大两种情况,在相应选择强度范围内得出了平均丰度函数近似效果显著的经验公式。对线性公共物品演化博弈模型,在倍增系数较小的条件下给出了平均丰度函数的显著近似表示,并证明了在倍增系数较大时近似效果不显著。对阈值公共物品演化博弈模型,分别在占优和不占优两种情况下将阈值和倍增系数的范围进行分类,给出了相应范围平均丰度函数的近似表示。最后,以三个多人演化博弈模型为对象,采用数据仿真方法计算和分析了多参数对于具有突变特性的平均丰度函数的影响。通过将有突变特征的平均丰度函数与无突变特征的平均丰度函数进行对比分析,发现在选择强度较小情况下,突变较小时平均丰度函数受参数的影响和干扰较小;而在选择强度较大情况下,即使突变较小,但平均丰度函数受参数的影响和干扰显著。同时结合相应参数和突变系数对收益函数π(i)和函数h(i,ω)的影响说明了产生相应变化趋势的原因,掌握了具有突变特性的平均丰度函数随相关参数的变化规律。