重复囚徒困境博弈的序贯决策机制及条件分离机制研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：sk01230147

【摘要】

：

囚徒困境博弈是研究动物以及人类社会中合作行为的最常用的博弈论模型，它的纳什均衡只有一个，就是所有参与人都选择背叛。然而在现实中，合作行为是无处不在的。对这一分歧的一个

【作者】

：

屈兴龙

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2015年期

【关键词】

：

博弈论决策机制均衡策略收益水平

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

囚徒困境博弈是研究动物以及人类社会中合作行为的最常用的博弈论模型，它的纳什均衡只有一个，就是所有参与人都选择背叛。然而在现实中，合作行为是无处不在的。对这一分歧的一个直接解释就是在现实中动物以及人们的交往都是重复进行而非只是一次。对个体在重复进行的博弈中的合作行为，研究者通常是从两个角度予以分析，一是从理性人个体微观决策角度展开的重复博弈研究，另一个是从种群宏观演化角度展开的演化博弈研究。　　从理性人微观决策角度出发，由于人们在每次博弈中做决策的时候需要考虑当前决策对将来结果的影响，因而能够与对手达成对双方最优的长期合作局面。以往关于重复博弈的研究大部分假设参与人在重复博弈中的地位是对等的。在这些研究中，虽然重复博弈本身是动态的博弈过程，但是博弈的形式仍然是标准形式的博弈。现实中存在大量的例子表明，人们在博弈中的地位是非对称的。本文研究了Stackleberg形式的重复囚徒困境博弈。在研究中，一名参与人（先行者）先制定自己在重复博弈中的策略并将该策略公布给另一名参与人（跟随者），跟随者然后再制定重复博弈中的策略。研究了该博弈的子博弈精炼纳什均衡以及均衡下两名参与人的策略和收益，主要的发现有:在平均收益下，博弈存在唯一的子博弈精炼纳什均衡收益;在该均衡收益下，先行者具有绝对优势，他的收益是所有理性结果中的最大收益，而跟随者只能获得理性收益水平，也就是两个人都背叛时的收益;存在一类简单的策略是先行者的均衡策略，这些策略是一步记忆的平稳策略，我们称之为“邪恶策略”;在所有的子博弈精炼纳什均衡策略中，对于先行者而言，邪恶策略恰恰是其全部一步记忆的均衡策略;邪恶策略与最近发现的零行列式策略有紧密的联系，两者的交集总是非空的，而且交集恰恰位于邪恶策略的边界上。　　从种群宏观演化角度研究哪些演化机制能够促进合作行为的涌现是演化博弈论的主要研究问题之一。由于背叛是囚徒困境博弈中唯一的纳什均衡，因此合作涌现离不开特定的演化条件。最近的研究表明条件分离机制也能够促进合作的涌现和稳定。然而，在这些研究中，个体的策略总是被限定为纯策略，这在现实中是很难实现的。此外，在这些研究中，条件分离机制往往与别的已知能够促进合作演化的机制混合在一起，这就无法让人们对条件分离机制的真实作用有清晰的认识。在我们的文章中，研究了一个非常单纯的模型，在避免了其他可能对演化结果有影响的机制的同时，对混合策略也能够进行分析讨论。我们发现，不论种群的策略空间是纯策略还是混合策略，条件分离机制都能通过提升种群内的正向搭配水平的方式够促进合作的演化。因而支撑了条件分离机制本身即可促进合作演化的论断。然而，与只允许个体采取纯策略相比，允许个体采取混合策略会抑制合作的水平。通过计算机仿真和对演化稳定策略的理论分析发现，种群演化的最终策略大致可以分为两类，一类是合作者但是对背叛行为的容忍度有限，另一类是背叛者同时对背叛行为完全容忍。还考虑了建立伙伴关系所需要的时间成本问题，这在我们的模型里通过等待时间来描述，这种等待可以看作是对个体的一种惩罚。我们发现，合作水平会随着惩罚的加重，即等待时间的变长，而得到提升，但是随着等待时间继续变长，合作水平会稳定下来。

其他文献

我国医疗卫生服务资源配置与需求预测研究

随着人均预期寿命提高和老龄化进程加快，中国人口年龄结构将发生巨大变化，医疗卫生服务需求显著上升。同时，随着新型城镇化的快速推进，大量人口跨城乡和区域转移，医疗卫生服务的公

学位

医疗卫生服务资源配置需求预测评估体系

玉米通透栽培技术总结

玉米是我县主要作物之一,在历史上曾为我县粮食单产提高,总产增加做出突出贡献,特别是近几看来,随着我县畜牧业和加工业的发展,玉米生产也显的尤为重要,特别是在玉米栽培面积

期刊

玉米栽培栽培技术紧凑型品种种植密度粮食单产年有效积温半紧凑型亩播量种植方式紧凑型玉米

分销渠道战略：寡头垄断行业分销规模和渠道势力的研究

该文通过追述科斯提出的企业的两种主要经营活动,市场经营活动（Marketing）和生产经营活动(Producing),提出研究分销渠道的必要性,然后引用中国改革与发展报告专家组（张维迎等）的"

学位

分销渠道分销规模渠道势力契约理论寡头垄断行业

杭州湾地区土地非农化驱动力及机制研究

杭州湾地区是一个人多地少的地区,而目前杭州湾地区正处于飞速发展的时期,这对于杭州湾地区土地的可持续利用提出了严峻的现实挑战,因而研究杭州湾地区土地的可持续利用就具

学位

土地可持续利用土地非农化土地非农化机制驱动因素杭州湾地区

移动商务与企业信息系统集成应用研究

随着移动通信技术与互联网的迅猛发展,无线网络正在与互联网技术走向融合,基于移动互联网的电子商务应用已经成为一种重要的商业运作方式,移动商务的概念便应运而生。移动商

学位

移动商务企业信息化灰色关联分析法系统集成

分享经济的特征和关键性问题研究

分享经济是2008年经济危机后出现的经济新现象，同时也是信息技术发展到一定阶段的产物。人们已经意识到分享经济能够整合个人闲置资源，变闲置为有用，是一种新的经济形态。人类社

学位

分享经济供给模式成本分析商业模式监管机制

uPCA3mRNA及PCA3mRNA/D定量检测对PSA灰区前列腺癌诊断的临床研究

目的:研究前列腺按摩后尿液中PCA3mRNA及PCA3mRNA密度的定量检测在前列腺特异性抗原(PSA)灰区前列腺癌(PCa)临床诊断中的应用价值。方法:选择sPSA在4~10ng/ml的BPH或PCa患者2

期刊

PCA3mRNA/DPSAuPCA3mRNA前列腺癌PCA3基因前列腺癌诊断前列腺按摩PSAD定量灰区

物流金融模式下的企业及银行风险管理研究

物流金融指在供应链业务活动中,运用金融工具使物流产生增值的融资活动,是一种为中小企业、物流企业和银行之间合作提供平台,利用物流企业流通、监管服务以及银行资金优势实

学位

物流金融模式企业集团商业银行风险管理

文化产业发展研究

文化产业,被称为21世纪的朝阳产业,将成为未来世界经济的新的增长点.当代文化产业在世界上取得了飞速的发展,在社会功能和经济内涵上出现了一些新的特点和新趋势.中国文化产

学位

文化产业产业发展发展对策WTO

东盛集团电子商务系统的建设

该文主要以东盛集团电子商务系统的建设为背景,结合国内医药行业的实际情况,提出了企业广义电子商务的一个模型.并结合东盛集团电子商务系统的建设过程,提出了电子商务的实施

学位

管理信息系统电子商务电子市场产品目录产品代理产品竞价销售管理系统工作流管理

重复囚徒困境博弈的序贯决策机制及条件分离机制研究

与本文相关的学术论文