关于囚徒困境的思考

来源 :时代金融 | 被引量 : 0次 | 上传用户:nanti
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】囚徒困境是博弈论中具有代表性的例子,反应个人最佳选择并非集体最佳的情况,属于非零和博弈的一种。它告诉我们,看待问题的角度会对我们所得的结果有很大的影响。当我们悲观面对时,结局是悲惨的;但当我们乐观面对时,结局是美好的。
  【关键词】囚徒困境 博弈 经济学思考
  囚徒困境是博弈论中具有代表性的例子,反应个人最佳选择并非集体最佳的情况,属于非零和博弈的一种。虽然困境本身只是一种模型,但在实际生活中的价格竞争,环境保护等方面有多种类似的情形存在。对囚徒困境的研究,是对生活中各种博弈的一种基本形式的研究,对我们在实际生活中更好的认识各事物间的关系有很大的帮助。
  下面我们从两个人各自的角度来看,由于每个人都是自私的,都会寻求自身利益最大化,所以当他们从自己的角度去看待这个问题的时候,都只会选择最优于自己的方案。
  对于集体而言,当两人都选择不坦白时两人都会有最好的结局,但是由于他们之间不能互通信息,所以每一方都担心对方坦白而自己不坦白时自己所遭受的重判。在这种情况下,每个囚犯从自己的利益考虑,最后的选择都是坦白,即图中二人的选择重合的部分。虽然这种结果达到了这个博弈的占有策略均衡,及纳什均衡,但并未达到帕累托最优状态,这种个人最佳选择与集体最佳选择不一致的情况就是囚徒困境。
  前面所分析的博弈只是一次性的,即每个囚犯只有一次选择的机会,而且,在每个囚犯选择自己的策略是,他并不知道对方的选择。也可以理解为,每个囚犯只是做出了自己的一次性选择。在一次性的困境中,每个囚犯的策略选定了,则整个博弈的均衡结局也就确定了,每个囚犯都不可能再对博弈的过程和结果时间什么影响,即静态博弈。与之相对应的是动态博弈。动态博弈是反复进行的博弈。重复的博弈是动态博弈的一种特殊情况,在重复的囚徒困境中,结构相同的困境被重复多次。
  下面我们从囚徒困境发生次数的不同来看待其结果是否相同。
  如果囚徒困境只发生一次,则二者都必会为自身的利益最大化而坦白一切。
  如果使囚徒困境发生的次数大于一次,则概括而言囚徒困境进行第一次后会出现以下两种情况:
  (1)甲在第一次中被乙指控,即会在第二次指控乙,最终导致,甲即时获释,乙服刑10年。若乙的想法和甲一样,同样指控了甲,则二人同服刑8年。
  (2)双方均保持沉默,即会建立互信的合作关系,最终导致,二人同服刑1年。
  但互信的关系并非牢不可破,这一点也可以被利用,即甲,乙在第一次中共同选择了沉默而赢得对方的信任,进而进行合作,但甲或乙中的一人可以在获得对方的信任后,都会为了自己的利益考虑,利用对方的信任以获取自身利益最大化,即指控对方获得自由,而对方将服刑10年。这是一个以牺牲对方利益为代价而获得自身最大利益的一种策略。但是,这种策略并不会长久得逞,在重复的博弈中,对方会在后面的次数中进行报复。
  如果假设,两个囚徒均欲利用此策略,并将局数推演为十次,那么就会出现如下的情况:在第一局到第九局的过程中双方均会保持沉默,以期望建立互信关系,并在最后一局,即第十局指控对方,这将最终导致,二人同服刑1年。
  若再一次假设,双方都明确对方会使用与自己同样的策略,即知道对方会在第十局中指控自己,这样,一般认为在第九局时两者间的合作关系的建立即是没有意义的,如此类推,第八局到第一局中的合作关系的建立也同样是没有意义的,即第十局双方都会互相背叛,也就是纳什均衡。由此可推论,在如此的情况下,只有在囚徒困境的局数在不确定的情况下(即双方均不知道进行的局数),才会出现互相保持沉默以获得信任保持合作关系的现象。
  以上一段是通常的看法。然而我个人认为,从始至终的信任关系是有意义的。既然二人都已知囚徒困境共有十次,并准确判断在第十次时指控对方会获得自身利益最大化,并且两人都知道对方将在最后一次他们互相指控,并分别服刑8年。那么如果他们继续保持合作关系,则可使每人的服刑年数减少到1年,这也提高了自身利益。同时,由于困境发生十次,那么前九次的合作关系就尤为重要了,因为任何一次的背叛都会使同伴在下一次的困境中进行报复,而被报复的人也可以对此进行预知,这样循环往复,两人都会被不断判处8年刑期,显然这并不是最好的选择。我认为,在一切前提都已知的情况下,假设信息是完全的,即两个囚犯都已知困境的次数以及判刑的标准,那么两人从第一次开始便保持沉默进行合作,直到最后一次仍保持沉默,这样两个人的利益才是最大化的。即使不是父子或者情侣,只要是理性的囚犯,就应该选择这种最优的方式。即我个人认为,从第一局到最后一局二人都保持合作关系才能达到帕累托最优状态。
  当然,当困境局数不确定,或一直进行下去的话,由于双方不知道困境什么时候会结束,或者不知道自己的生命什么时候是尽头,那么保持沉默维持合作关系无疑是最好的选择。即当博弈无限重复,则囚徒可走出困境。
  然而,不可避免有另一种情况,就是在重复的困境中,博弈的双方中有一方为了自身的利益会选择背叛,可能是想赌一次“最后一局”,或者知道自己命不久矣,只能进行着最后一次的博弈,或者仅仅是厌烦了每一次都有1年的刑期,想要立即获得自由,于是他产生了邪恶的念头,打算打破合作关系去指控对方以获得自由。并且,在对方完全不知情的情况下,他的这一念头觉得可以其作用,于是他得逞了,立即被释放,而他的同伴则在监狱中苦等10年。
  当10年过去了,监狱中的囚犯终于出狱,囚徒困境继续出现。由于在上一次的博弈中,一名囚犯的背叛导致了另一名囚犯的利益损失,被囚禁的囚犯在10年的牢狱之苦中对对方的背叛一直耿耿于怀,于是在他出狱后的第一次博弈中,他毅然决然地选择了指控对方,虽然他知道结果可能是他们两个人同时被关8年, 也可能是只有对方关10年,虽然他的遭遇很有可能变化坏,但他必须要惩罚对方曾经的背叛,于是这种指控也可以看作为一种报复行为或惩罚行为。我们可以称之为“以牙还牙”。若双方持续着互相报复的行为,则无疑他们的情况与先前互相合作时相比都会差很多,理性的囚犯最终放弃了报复,继续进行合作。当一方开始保持沉默时,另一方便会当局博弈结束时得知,考虑到为了使自己的情况变得更好,他也会选择与对方重新建立合作关系,于是新一轮的合作又开始了。
  这种“以牙还牙”的方法无疑也是使囚徒走出困境的好方法,前提任然是困境无限重复下去,二者会在经历了合作、背叛、报复、重新合作后最终达到最优状态。当然,不要首先背叛是囚徒走出困境的最佳捷径。
  在这些博弈中,如果信息是完全的,则每个人的决定都会影响对方的选择。但由于二者的信息是不可知的,就会导致二人各自出于对自身利益的考虑,在博弈中假设对方选择了最不利于自己的策略,进而选择对自己伤害最小的可能,然而实际的结果是二者的处境都不好。但如果从另一个角度去看待这场博弈,因为博弈并非如下棋一样必会一胜一负,在博弈中的每个人不一定要争取自身的优胜,因为大多数的博弈都不是零和的,囚徒困境也不是,双方可以通过合作达到共赢的效果,这样使每个人的情况都更好。这就需要博弈的双方在信息不可知的前提下假设对方选择了最有利于自己的策略,当双方的想法一致时,二者自然也就叨叨了最好的状态。
  由此可得,我们看待问题的角度会对我们所得的结果有很大的影响。当我们悲观面对时,结局是悲惨的;但当我们乐观面对时,结局是美好的。
  从以上的各种假设中我们讨论了囚徒困境的各种情况和解决方案,这些在现实中的应用也是很广泛的。比如,在经济市场中互相合作的厂商,他们对其协议的遵守与否就像囚犯是否继续保持沉默进行合作一样。又如国与国之间进行的军备竞争,增加军备是因为对方的增持,为了本国的安全不得不增加,但在和平年代这种增持无疑是对资源的浪费,若两国达成削减武器的协议,其遵守与否又再一次来到了囚徒困境。
  在实际生活中与囚徒困境类似的博弈还有很多,正确的认识囚徒困境的基本理论和走出困境的办法对我们更好地解决生活中的问题有很大的帮助,对此类博弈的思考也让人感觉乐趣无穷。
  参考文献
  [1] 格里高利.曼昆.经济学原理[M].3版.梁小民,译.北京:机械工业出版社,20003.
  [2] 高鸿业.西方经济学:微观部分[M].4版.北京:中国人民大学出版社,2007.
  作者简介:吕玲玉(1993-),女,西南财经大学会计学院财务管理专业2010级本科生,研究方向:财务管理。
  (责任编辑:龙大为)
其他文献
【摘要】全民医保体系的形成,医疗保险工作对保障和改善民生发挥了重要的积极作用。本文主要针对推动医疗保险由扩大范围向提升质量转变进行了简单分析和探讨。  【关键词】医疗保险 提升质量 转变  随着新的形势变化,医保事业也不断面临着新的要求,因此,要想完成医疗保险由扩大范围向提升质量转变,就必须要加强对医疗保险现有情况的分析,并结合形势变化,切实保证医保政策的执行。  一、医疗保险发展现状  随着医改
期刊
@@
【摘要】我国收入分配方面存在收入差距过大、初次分配秩序欠缺规范、再分配的调节力度不足等问题,这些问题在一定程度上严重影响我国经济社会的转型与可持续发展。加强收入分配制度改革对当前社会调整各种利益关系、实现共同富裕、社会公平正义具有非常重要的意义,对扩大内需、转变经济发展方式和调整经济结构具有根基性价值意义。  【关键词】收入分配现状 分配问题 分配制度  一、我国收入分配的现状  1978到2
供应链金融的产生是符合经济发展规律的,它的发展有效地解决了供应链面临的融资困境,同时为金融机构提供了一种新的盈利模式;具有巨大的发展潜力。 The emergence of supply
随着国家职业教育发展的不断加快,校企合作的不断加强,企业用工的不断紧张,学校专业发展的不断深化,学生技能的不断提高,现代学徒制在高职院校中越来越受到重视。依托校企合
锣鼓是戏曲表演中非常重要的部分,它通过独特的功能和特点,使戏曲舞台变得更加有艺术魅力.本文简单分析了锣鼓音乐的基本特点、功能运用以及在戏曲中的作用.
随着我国资本项目的逐渐开放,各种各样的问题开始逐渐显现.我国国际收支平衡表中所体现的各种问题都一定程度上源于我国现行外汇管理模式本身的弊端,本文从目前我国外汇管理
【摘要】国家针对房地产行业相继出台了一系列调控政策,目的是抑制其市场价格上涨过快,保证居者有其屋,国家外汇管理局适时跟进,加强对涉外房地产企业的管理,确保房地产市场的健康、有序发展。实际工作中,大量外商房地产企业动作频频,外汇资金徘徊于外汇监管政策左右,极易对国家宏观政策、外汇政策形成制约,应高度关注。  【关键词】房地产 外汇 管理 政策  一、涉外房地产企业异动的具体表现  (一)企业出
本文简单的介绍了一下自媒体的涵义,详细的阐述了在自媒体时代大学生思想政治教育方法的创新措施.
目的:探究急性百草枯中毒合并中期妊娠患者的急救护理。方法:对1例急性百草枯中毒合并中期妊娠患者进行早期急救处理及相应护理。结果:经积极抢救及相应精心护理后患者治愈出院