重复囚徒困境模型中零行列式策略的研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:windlam
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文研究了重复囚徒困境模型中零行列式(zero-determinant,ZD)策略之间或与经典策略(All C、All D、TFT、WSLS)之间的博弈关系。在零行列式策略的集合中,存在一类敲诈型策略,参与者使用该敲诈型策略获得的收益相对于参考相互不合作的收益的盈余,可以是其竞争对手的χ(χ>1)倍。本文推广参考相互不合作收益至更一般的情形,即通过调节参数σ(σ∈[0,1])使得参考收益值可以在相互不合作收益与相互合作收益之间连续变化。我们推导了ZD策略与ZD策略或者ZD策略与各个经典策略进行博弈的期望收益表达式。首先研究了策略在有限大小的全局耦合人群以及二维正方格子人群中的博弈演化行为,该演化行为是在基于参与者模仿表现更好的近邻策略的规则下进行。我们发现通过调节σ,敲诈型ZD策略(σ~0),虽然可以获得比对手更多的收益盈余,但是这类敲诈型ZD策略在群体中不具有演化稳定性。相反,慷慨型ZD策略(σ~1),虽然让对手获得更多的收益盈余,但这类慷慨型的ZD策略可以和其他策略在人群中共存,甚至打败其他策略,从而占据优势地位。本文通过对比全局耦合人群中ZD策略之间以及ZD策略与经典策略博弈时的平均收益,从理论及计算机模拟分析了系统达到平衡态时ZD策略的浓度,并利用收益带理论分析了各类策略在二维正方格子上的演化行为。本论文还提出并研究了一种自适应的ZD策略和经典策略在参与者之间具有空间结构人际关系系统中的博弈演化行为。参与者除了可以有一定几率模仿表现好的近邻策略的能力外,使用ZD策略的参与者还可以有一定的更新几率根据所处的竞争环境来调整自己的ZD策略。这种自适应ZD策略可以自我调整为敲诈型ZD策略,来避免在遇到背叛者时一直被对手欺诈或者在遇到无条件合作的参与者时占据优势。自适应ZD策略也可以在遇到有条件合作的策略时进化为慷慨型策略。这种自适应机制可以让ZD策略更具竞争力。模拟结果表明,当ZD策略更快地进行自适应而不是模仿其他策略时,自适应的ZD策略可以打败其他策略或者至少可以与其他策略在系统中共存。
其他文献
本实验通过酸裂解的方法从甲型副伤寒沙门氏菌分离出粗制鞭毛蛋白,并经除盐、弱阴离子交换,获得纯化的鞭毛蛋白。用其免疫大鼠,约7-8 周后获得高效价的抗血清。然后通过盲肠
神华宁煤集团作为宁夏最大的优势骨干企业,为了更好的完成企业战略目标、实现企业社会价值,首要任务之一是优化企业管理结构、提高企业管理能力,这对神华宁煤集团的物资仓储管理系统提出了新要求。优化物资仓储管理的运行机制,加强物资仓储管理的统筹协调能力,建立企业级物资集成管理信息系统,并增强物资部门的信息共享能力是满足新要求的有效方法。本文重点对现阶段神华宁煤集团的仓储管理现状进行了需求和可行性分析,针对具
对于工业化与城市化的关系,国内外学者都进行了大量的研究与经济学分析,但对于产业集群与工业化以及产业集群与城市化的互动关系则关注不够。从实证与理论的角度对产业集群、
对拮抗长枝木霉(rlongibrachiatum)T115D菌株发酵条件进行研究。结果表明,以PD作为培养液,适宜木霉菌T115D产生孢子的pH值是7.0~8.0,温度是30℃,转速为200~250r/min;适宜菌丝生长的pH值是
比较法冠被以“法”的称谓,并不是因为比较法成为了独立的法律部门。在现代社会,把比较法视为一种法律科学已经是必然趋势。而作为一门科学,比较法自身就承担着提供科学方法
[目的]设计简易呼吸衰竭预后评价系统。 [方法]前瞻性收集呼吸衰竭的患者102例,因子分析筛选预后指标,logistic回归死亡危险度法确定各指标等级分值,建立SURFES评分表。对101
印度洋不仅是印度和西方国家的海上生命线.对中国亦具有同样重要的战略地位。这主要是因为随着中国能源需求量的不断增长.从中东横跨印度洋途经马六甲海峡的海上航线.实际已成为
政府在现代经济社会中担任两种角色,一种是社会经济管理者,另一种是国资所有者。如何对国企实施有效监管,一直是政府工作的重点和难点。我国"委托代理"制使政府对国企监管难
钢铁企业品牌意识的缺乏,是我国钢铁企业参与国内外市场竞争的最大障碍。品牌并非可有可无,它是企业重要的无形资产,是企业获得竞争优势的必备条件。实施品牌战略,是钢铁生产
竞技体育作为当前世界流行文化的重要组成部分,熔融了大量民族主义色彩,成为民族情绪表达与宣泄的重要舞台。各国为了提高民族情感与凝聚力往往会注重发展竞技体育,从这个意义上