蜈蚣博弈悖论的探析

来源 :大观周刊 | 被引量 : 0次 | 上传用户:hwangh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:逆推归纳法是博弈论中的一种重要的推理方法。但是,它的运用有时会背离了人们的直觉,造成了博弈理论推理与实际中人们的真实行动的不一致。这就是所谓的逆向归纳悖论,蜈蚣博弈悖论则是它的一个典型。本文揭示了逆推归纳悖论产生的根源是只重视眼前(短期)利益,而忽略了长远利益。即在眼前利益和长远利益的分析下,逆推归纳论是不存在的。
  关键词:逆推归纳法 蜈蚣博弈 逆向归纳悖论
  一、蜈蚣博弈悖论
  博弈(game playing)的词语解释是游戏、围棋、赌博。博弈是指在多决策主体之间的行为具有相互作用时,各主体根据所掌握信息及对自身能力的认知,做出有利于自己的决策的一种行为。虽然,博弈的思想自古以来就存在,比如我国古代有名的田忌赛马的故事就是一个典型的博弈问题。但是,早期对博弈思想的认识仅仅停留在经验方面,并没有形成专门的理论体系。一直到20世纪以后,博弈才形成了自己的理论体系,正式发展成为一门学科,即博弈论(game theory)。博弈论是根据信息分析及能力判断,研究多决策主体之间的行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论。博弈论的研究方法是从复杂的现象中抽象出基本的元素(或概念),并对这些由基本元素构成的模型进行详尽分析,随后逐步引入对其形式产生影响的其他因素,从而分析出可能的结果。也可以说博弈论作为一种分析工具,为研究人类理性行为提供了一种可行、通用的方法。目前,博弈论在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他一些学科中都有着广泛的应用。
  悖论(paradox),也称逆论、反论,是指在逻辑上可以推导出互相矛盾的结论,但表面上却能自圆其说的命题或理论体系。悖论形成的原因极其复杂和深刻, 因此,对悖论的深入研究能够为数学、逻辑学、语义学等相关理论学科的进步和发展做出贡献。所以,悖论有十分重要的研究必要和研究价值。其中经典的悖论有罗素悖论、说谎者悖论、康托悖论等等。
  逆向归纳法(backward induction),又称之为逆推归纳法,顾名思义,就是在序列中从最后往前端进行一种递归推理,是博弈论中的一种重要的推理方法。这种方法主要作用于对完全信息动态博弈的求解。它的运用虽然可以在众多的纳什均衡中确定唯一的均衡解,但是,有些时候通过逆向归纳推理所得到的关于博弈局中人的理论预测却出乎意料地背离了人们的直觉,造成了博弈理论推理和实际中人们的真实行动的不一致,这也就是所谓的逆向归纳悖论(backward induction paradox)。
  蜈蚣博弈悖论(centipede game),简称蜈蚣博弈,就是逆推归纳法悖论中的一个典型。它是在博弈论及博弈逻辑的研究中发现的悖论,是由罗森塞尔(Rosenthal)在1981年提出的一个完全信息动态博弈问题,一种合理行为选择的悖论。由于这个博弈的扩展形态很像一条蜈蚣,因而被称为“蜈蚣博弈”。它是指这样的一个博弈:有两个局中人A和B,他们轮流进行决策的选择:可供选择的策略有‘合作’和‘不合作’两种。假定A先进行策略的选择,然后是B选择策略,这样交替的进行策略的选择。假定A、B之间的博弈次数是有限的,比如198次。假定这个博弈的各自支付给定如下图:
  如图所示,只要A、B双方有一方选择‘不合作’策略,该博弈就结束。A、B双方在结束博弈后的得益为得益数组中的数字。所有得益数组里的第一个数字是局中人A的得益,第二个数字则是局中人B的得益。当A、B选择了198次‘合作’策略后的得益各为100。
  但是,根据逆推归纳法分析这个博弈,在最后一步即第198步时,B在‘合作’和‘不合作’的策略中做出选择,根据理性人的假定,B会选择带来收益101的‘不合作’策略,以此往前一一递推。最后得出的结论却是:在第一步时A就会选择‘不合作’的策略来结束这个博弈。此时,A、B各自的收益都仅为1,这与正向推理时A、B各自的收益为100的结果完全相反,出现悖论。从逻辑推理来看,逆推归纳法是严密的,但结论却违反了人们的直觉。而且,在針对蜈蚣博弈进行的实验结果也表明,在绝大多数的博弈中,一般都不会出现由逆推归纳法所预测的局内人A在一开始就选择‘不合作’的策略结束博弈的情况。因而,人们在博弈中的真实行动偏离了运用逆推归纳法得出的预测,造成两者之间的矛盾和不一致,这也就是蜈蚣博弈产生的悖论。
  二、对蜈蚣悖论的追问
  究其原因,就引出了一系列的问题:为什么会出现蜈蚣悖论?产生蜈蚣悖论的原因是什么?是逆推归纳法出错了?是这个博弈本身有问题?是人们的直觉错误了?究竟哪个环节出错了?这些问题都成为人们不得不思考的问题。
  当然,有很多的学者对此进行了分析和研究,试图来回答着一系列的问题。但是,由于每个学者研究的角度、方法不同,他们也得出了不同的结论:有的学者认为是逆推归纳法导致了这个悖论的产生,而且深入的分析了逆推归纳法的缺陷和适用范围;有的学者则认为是最初的“理性人”和“公共知识理性”的假定造成了这样的结果,并探讨了局内人的“理性”和“非理性”对决策过程和决策结果的影响;还有的学者认为是“信息”的不对称从而产生了这样的偏差,并阐述了信息的完整性对于局内人做出决策的重要作用;有的学者认为这个博弈反映的就不是悖论,所谓的蜈蚣悖论是不存在的。这些结论为我们进一步研究蜈蚣悖论提供了依据。
  但是,如果从短期利益和长期利益的角度来分析蜈蚣悖论,就会发现所谓的悖论是不存在的,只是对短期利益和长期利益的不同考虑造成的结果不同而已。
  三、眼前利益、长期利益的不同
  根据逆推归纳法进行反向推理时,B选择‘不合作’的主要理由就是在第198步时,B选择‘合作’的收益低于选择‘不合作’的收益,即B只看到了眼前利益而忽视了长期利益。按照局内人对眼前利益的选择,并且假定局内人A、B都是‘理性人’,而且也知道对方是‘理性人’的情况下,我们从正向来推理这个博弈。   当A在做出第一步选择的时候就要考虑到自己的收益。那么,如果A选择‘不合作’得到收益为1,选择‘合作’后的收益就得由B下一步的选择决定。如果B选择‘不合作’,A的收益就为3,明显高于B选择‘合作’后的收益,那么作为‘理性人’的B肯定会选择‘不合作’,经过分析后,A不得不选择‘不合作’来保证自己的收益为1而不是0,博弈就会在第一步结束。那么,这个推理结果就会与逆推归纳法得到的结果一致,也就是局内人A、B只考虑眼前利益而且把眼前利益最大化的结果。
  而且,整个博弈的过程来看,每次A选择‘不合作’时,A、B的收益是一样的,但是B选择‘不合作’时,收益就会比A多3,那么基于‘理性人’的考虑,B选择‘不合作’的概率就远远大于A选择‘不合作’的概率。但是B要得到选择‘不合作’的权利,却必须通过A选择‘合作’后才行,换句话说要得到多于A的收益必须建立在A选择‘合作’的基础上。可是,如果A仔细观察就会发现如果第一次选择‘不合作’时收益为1,如果选择‘合作’就等于把自己收益是1还是0的选择权交给了B。但是,B选择‘不合作’概率远远大于‘合作’,那么,最后A都会不得不选择‘不合作’来结束博弈,从而确保自己的收益与B的相同。即使在第一步就结束,各自的利益为1,也不给予B得到远远高于自己利益的选择机会。
  再者,从上面的分析也可以进一步看到,局内人A看起来是拥有优先的选择权,但是从收益来看B的优势明显大于A。那么,作为‘理性人’的A为何要选择‘合作’来发起一个收益不如局内人B的行为呢?
  但是,如果从长远利益的角度来分析的话,局内人A、B会尽可能的多选择‘合作’来增加各自的收益,因为他们看到当进行到第198步时,各自的收益均为100,这肯定是A、B都满意的结果。所以,在进行博弈的时候,A和B都会为了100的收益选择‘合作’,因为一旦选择‘不合作’博弈就终止了。每多选择一次‘合作’,他们各自的收益就会增加1,因此A和B都愿意‘合作’,而且是长期的‘合作’,直到各自得到最大的收益。这也正是这个博弈得以进行下去的主要原因,即A和B都基于对长期利益的考虑而展开‘合作’从而得到收益。但是,根据逆推归纳法分析这个博弈时,却只看到眼前利益的多少,没有考虑到这个博弈得以展开的深层次原因,所以得到的结果与现实情况和人们的直觉不同。
  四、结论
  因而,根本不是逆推归纳法出了问题,而是在进行反向推理时考虑的条件出了问题。也就是说这个博弈之所以能进行到最后一步A和B都是基于长期利益最大化进行的。如果局内人A、B都用每一步选择‘合作’或‘不合作’的收益多少作为考虑的话,这个博弈就注定只能是A在第一步时选择‘不合作’来得到各自相同且为1的收益来终止。
  所以,这个悖论根本不能称之为悖论,仅仅是由于在反向逆推时以进行了错误的考虑,忽视了整个博弈得以进行的原因,从而得到与事实不符的结果。所谓悖论只是注重眼前利益还是注重长期利益的不同选择造成的不同结果而已,所以這个悖论是不存在的。
  参考文献:
  [1]张峰.逆推归纳法悖论探析[J].福建论坛(人文社会科学版),2004,12:78—81.
  [2]张峰.蜈蚣博弈悖论引发的思考[J].湖南科技大学学报(社会科学版),2005,8(1):30—33.
  [3].潘天群.博弈论中理性人假设的困境[J].经济学家,2003,(4)
  [4]蒋正峰 逆向归纳悖论研究[D].华南师范大学 2003
其他文献
摘要:随着教育改革浪潮的不断推进,素质教育的实施势在必行,加强校外教育体制是现代教育发展的必然要求。本文主要从加强校外教育存在的问题;校外教育开发的意义;加大校外教育资源利用的几点建议几方面做了阐述。  关键词:校外教育 体制 建议  党的十八大报告提出,全面实施素质教育,培养学生社会责任感、创新精神、实践能力。近年来,建设社区教育的重要组成部分青少年活动中心校外文化教育活动势在必行,以提高青少年
期刊
摘要:在所有的教育资源中,视频资源作为一种可以有效呈现教学内容和教学手段的教学媒体形式,有着文字、图画、动画等传统媒体所不具备的优势和特点。我国电磁学视频资源共享课普遍存在画面单一,信息量少及与现代科技及社会生活联系少的问题,为此在对视频录像进行再创作时可以通过适当的渗透方式融入物理学史,现代前沿知识及课件演示实验,揭示知识产生的背景和原始动力,探究物理规律的发现和体验物理问题的解决过程,介绍科学
期刊
摘要:1948年5月,毛泽东同志率领中共中央、中国人民解放军总部从延安移驻西柏坡,在这里召开了具有伟大历史意义的七届二中全会,自此西柏坡成为重要的革命根据地,同时在这里也产生了伟大的革命精神——西柏坡精神。作为当代大学生党员,我们应该认真的思考西柏坡精神是一种什么样的精神?我们又应该如何将西柏坡精神永远的传承下去?  关键词:西柏坡精神 当代大学生 传承  1.西柏坡精神在新中国建立中占有重要的地
期刊
摘要:学习动机是引起和维持个体的活动,并使活动朝向某一目标的内部动力。合理学习动机有利于促进学生英语学习能力的提高;非合理的学习动机会阻碍学生学习英语。同时,本文指出教师采取多样化教学方法,寓教于乐,鼓励式评价方式,增强学生信心;布置难度适中的任务,降低学生焦虑;引导学生正确地归因,坚持努力;重视英语学习的价值,强化动机,能有效地激发学生英语学习动机,从而实现有效教学。  关键词:有效 英语教师
期刊
摘要:班主任工作是学校的一个重要组成部分。班级是教师和学生开展活动最基本的组织形式,是学校教育、教学工作的基层单位。而班主任则是班级工作的直接组织者和管理者,班主任管理的好坏直接影响着学生的健康成长和学校的办学质量,班级管理的好坏直接影响着整个学校的校风校纪。因此,加强班级管理,是办学的迫切需求。班级管理师一门艺术。  下面,就班主任的管理艺术谈谈自己的一些浅识和做法:  关键词:班主任 管理 教
期刊
摘要:在中学化学课堂教学中,为了让教师在在课堂40分钟有限的时间内达到良好的教学效果,就必须改革教学方法。“设疑激思”法是根据相应教学内容,教师精心设置疑问,通过学生完成化学实验和对化学问题的探究,在课堂内使学生积极思索,勇于探索。“设疑激思”法根据每一堂课的教学内容、重点、难点和疑点,层层设计、导出疑问,拟定若干个问题,将为何设置这样的疑问和如何寻求解决问题的方法,贯穿于课堂教学的始末。使学生感
期刊
一、项目介绍  《中国节日志》项目是国家社科基金特别委托项目,由文化部民间文艺发展中心规划执行。我校承担了《中国节日志·开斋节、古尔邦节》的撰写任务。为了完成这一任务,我院民族学硕士点的同学,分组分区参加了开斋节、古尔邦节的调研。  二、笔者的田野工作  2011年8月,本人做莎车县乌孜别克族开斋节调查。调查前没有人系统的指导过,调研报告被导师定为失败。2011年11月再一次对莎车县乌孜别克族古尔
期刊
摘要:对于批发企业,由于其行业本身的分散性和覆盖广的特点,所以产生了时间差导致的供需不对称和空间差导致的供需不对称,相应地使得批发企业在不同阶段、不同区域的营运特点存在差异。本文从时间、空间两个角度分析批发企业存在的差异性,研究生命周期各阶段和区域、规模方面的差异性特点并提出相应的发展对策。  关键词:时间维度 空间维度 批发企业  长期以来批发企业处于杂乱、低端、零散的状态,这主要是由于其行业性
期刊
摘要:对社会结构和学科重组的基本理论模糊,将不可避免地导致社会整体意识混乱。有些专家学者不安本分随意发言误导百姓,是引发社会混乱的主要原因。为了让国家各阶层各行业安其位、司其职、乐其俗、知其责,我们必须建立一种科学合理的社会行业分工体系。建立规范统一的社会意识形态以及学科标准,才有可能实现国家长治久安。这本来不是本文应该思考的问题,但近百年来的社会大变革、大分化、大动荡、大转型,已经向全社会提出了
期刊
摘要:日本語の「らしい」という言葉は中国語の「像」という言葉は非常に似ている。しかし、「らしい」は必ずしも「像」と等しくない。異なった場合によって、その「らしい」と「像」の使い分けも違う。その二つの言葉はどのような共通点があるのか、どのような異なりがあるのかはこの論文の主な研究した問題である。この研究したまとめは中国語を勉強する日本人のためによく理解できるようにつくられたことである。  关键词:「
期刊