论文部分内容阅读
2005年10月10日下午1时,瑞典皇家科学院常任秘书贡诺·厄奎斯特和诺贝尔经济学奖评委会主席约尔根·韦布尔一起来到皇家科学院议事厅。他们庄重地宣布,2005年诺贝尔经济学奖授予有以色列和美国双重国籍的罗伯特·奥曼(Robert J.Aumann)和美国人托马斯·谢林(Thomas C.Schelling),以表彰他们在博弈论领域做出的突出贡献。他们将分享1000万瑞典克朗(约130万美元)的奖金。
为什么有些国家、团体和个人可以和平地解决冲突,而另一些国家、团体和个人却不断地被冲突困扰呢?
在说明他们的获奖理由时,约尔根·韦布尔说:“为什么有些国家、团体和个人可以和平地解决冲突,而另一些国家、团体和个人却不断地被冲突困扰呢?感谢奥曼和谢林的研究,为这一自古以来困扰我们的问题带来启迪。”
博弈论(Game Theory)是研究理性的人们在合作和冲突中如何决策和行动的理论,最初开始于策墨洛(1913年)、波雷尔(1921年)和约翰·冯·诺伊曼(1928年)的研究工作。1944年,数学家约翰·冯·诺伊曼和经济学家奥斯卡·摩根斯坦合著了伟大的奠基性著作 《博弈论与经济行为》 ,概括了经济主体的典型行为特征,提出了策略型与广义型等基本博弈模型、解的概念和主要分析方法,全面奠定了作为当代经济学研究前沿的博弈论的理论基础。
按照博弈参与方的相互合作与否,博弈论可以划分为合作博弈与非合作博弈两大研究领域。1994年纳什(John Nash)、泽尔滕(Reinhard Selten)、海萨尼(JohnHarsanyi)凭借在非合作博弈方面的均衡分析方面做出的开创性的贡献,一起率先获得了当年诺贝尔经济学奖。这次奥曼和谢林作为博弈论学者再获殊荣,则归功于他们在合作博弈方面做出的出色研究与巧妙应用。
当年得奖的纳什研究了什么
比奥曼他们早11年得奖的纳什主要研究非合作博弈,即人们在不合作状态下是如何进行决策的。非合作博弈研究中最重要的概念之一就是纳什均衡。著名的囚徒困境问题(Prison’s Dilemma)可以说明纳什均衡这个所谓“完美均衡”的主要思想。
比如警方抓到了两个罪犯,但是警察对于他们的罪行了解得不是非常清楚。这时,如果他们都招供了,按照罪行他们每人会被判5年徒刑;如果都不招供,根据警方实际掌握的证据,只能每人判一年;但是如果其中一个人招供,另一个人不招供,则招供的人将被赦免不判刑,而拒不招供的人会被重判6年。
警方一开始就把这两个罪犯分开关押。这时,每个罪犯都会盘算,在招供和不招供的两个选择中,如果自己招供了,而对方还没有招供,那么自己可以被赦免不判刑。理性的他们都会选择招供。这样两个人都招供了,根据他们自己招供的罪行,两人都被判5年刑。
我们可以发现这两个聪明的罪犯,为了减轻对自己的处罚,从个人利益最大化出发,理性地选择了招供,而最终自作自受地把自己处于被判5年徒刑的糟糕结局中。那么他们当初的选择错了吗?为什么当初的如意算盘会落空!
按照纳什非合作博弈的观点,这两个罪犯最终的结果必然就是这种“聪明反被聪明误”的下场。
奥曼这次为什么会得奖
可是这种“聪明的错误”在现实世界中好像并不普遍,更多的情况是这两个罪犯都拒不招供,最终往往是警方根据掌握的证据只能使每个人被判一年徒刑。这是为什么呢?
按照奥曼的研究,对博弈当事人之间长期互动的性质进行考察后可以发现,博弈的不同阶段是相互依赖的,其结果是理性博弈当事人的决策不仅受到其过去经历的影响,而且还要受未来潜在可能性的影响。对于那两个罪犯而言,虽然可能在一些困境中大家会“聪明反被聪明误”。但是,在某一次选择中,双方都可能“慷慨”一次而“不自私”地选择不招供。他们事后却发现,最后的结果反而会比招供更好,这样在以后他们就很容易做出同时拒不招供的默契。
在现实生活中,这种适当“不理性”的“慷慨”而使得自己的利益增加的情况仿佛更多。这就是奥曼所研究的重复合作博弈的一个简单示意。
在诺贝尔经济学奖颁奖典礼上,颁奖嘉宾称颂奥曼,“罗伯特·奥曼是正式对所谓‘无限重复博弈’作全面分析的第一人。他的研究准确确认了倚赖于长期关系,一段时间内可以维持什么样的结果。”
在研究重复博弈中,奥曼提出了“强均衡”概念,即任何参与博弈的人都不可能通过单方面改变策略来增加其收益。对于那两个罪犯而言,他们都不可能通过招供使得自己的处罚变轻。
“公共地的悲剧”同样也可以说明他的思想。比如大家出海打鱼,竭泽而渔,鱼很快就会没有了。这时大家相互之间的矛盾冲突也很多,但是相互达成“捕鱼协议”的可能性也就更大了。
奥曼认为重复博弈是一个讨价还价的过程,为此他设计了一个讨价还价模型把最初当作外生变量的议价者之间的沟通与交流内生化。同时,他还在一般均衡分析、最优配置、非线性系统、控制论、测度理论、不动点理论等方面进行了大量的基础性研究,其成果被广泛应用于经济学、数学、运筹学等诸多领域。
20世纪80年代以后,博弈论研究取得了飞速进展,作为研究前沿在经济学领域中日益显贵。这不少都应该归功于奥曼的功劳。他所做那些基础性的研究工作,就博弈论的核心问题所进行的开创性研究,深刻地影响并推动了博弈论研究的发展。此外,他还培养了Hart、Kreps和Tauman等一大批优秀的经济学家。
目前奥曼任耶路撒冷希伯莱大学理性分析中心教授、纽约州立大学斯坦尼分校经济系和决策科学院教授、以色列数学俱乐部主席、美国经济联合会荣誉会员等。同时,他还担任《国际对策论》杂志(IJGT)、《数理经济学》杂志、《经济学理论》杂志、《运筹学数学》等多家学术刊物的编辑,并先后获得以色列颁发的科学技术哈维奖和经济学奖。
谢林运用博弈论分析了些什么
不同于奥曼运用数学进行了大量博弈论基础性理论研究工作,谢林更多地从经济学的角度应用博弈论理论来分析现实问题。本届诺贝尔评奖委员对他的评价是:“谢林,这位自称‘周游不定的经济学家’,被证明是一位非常杰出、具有开创性的探险者。”
谢林在谈到自己和奥曼之间的区别时也说到:“我把自己看成是博弈论的使用者,而不是博弈论学者,能跟罗伯特·奥曼这位真正的博弈论学者共同获此殊荣,我感到非常的荣幸。”
已经85岁高龄的谢林是目前获得诺贝尔经济学奖年纪最大的学者。他在1951年获得哈佛大学经济学博士学位,在哈佛大学肯尼迪政府学院担任政治经济学教授,执教长达20年,并获得退休名誉教授的称号。他还在美国马里兰大学公共政策学院和经济系担任教授。他教授的课程除包括经济学理论外,还涉及外交、国家安全、核战略以及军控等多个不同领域。他也是美国国家科学院和医学院的荣誉会员及艺术科学学院会员,并担任过美国经济学协会主席和东方经济学协会主席。获得过RAND政策分析研究生院荣誉博士、塞德曼政治经济学大奖和国家科学院奖。
谢林作为当代非主流经济学家的代表人物之一,对于事物的本质有一种深刻的洞察。他的学术思想超越了主流经济学的“理性人”假设,摒弃了用数学表示经济学理论的研究范式,创立并发展了“非数理博弈理论”,运用精炼的语言和各种小模型,将博弈论的思想巧妙地运用到了军备控制、恐怖主义与犯罪、能源环境政策与气候变化、种族隔离、供不应求市场的分析、谈判以及人群的相互行为等社会政治经济诸多领域。
他认为讨价还价是个非零和博弈,通过对该现象进行深刻剖析,提出了一个不同于一般常识的结论:“在讨价还价的过程中,势弱的一方通常会成为强者。” 当一方认为对方不会作出让步时,协议就达成了。一方之所以会让步,是因为他知道对方已经不可能让步了。因此,我们可以认为,谈判的秘诀在于让对方相信你不会再让步了。对此我们也可以这样理解,把自己放到不利的谈判地位反而是有利的,即破釜沉舟反而可以转败为胜。
谢林的卓越睿智突出地体现在他于1960年发表的《冲突战略》(The Strategy ofConflict)中运用博弈论对国家之间的讨价还价行为的分析。这本书也是国际关系领域最具有开创性的理论著作之一。书中他指出导致战争发生的原因是人们全面判断后的决定而不是偶然事件。如果一方坚信另一方会发动突然袭击,战争就会爆发;一方发动突然袭击的原因在于确信对方没有反击能力,因此防止突然袭击的办法是给对方显示自己具有还击的能力。他还认为,报复能力远比抵抗能力有用;具有不确定性的报复比可以确定的报复更具有威慑力。这些独到的见解都被事实证明是解决国家冲突问题的上上签。
他说“20世纪后50年最重要的一件事情是有一件事情没有发生”,这是基于他对于核战争问题的精辟研究。在他另一本同样具有重大影响的著作《武器与影响》中,谢林对军备控制进行了深入浅出的研究。他指出:最好的核武器分布是双方都有还击能力,即没有一方可以一次性摧毁对方的还击能力,和平的基础就来自双方都具有二次还击的能力。在分析稳定威慑问题时,他描述了一场西部牛仔决斗的场景,“如果双方都确定自己在临死之前能够进行有把握的准确还击,那么先开枪的一方将无任何优势而言,这样也就无需害怕对方先开枪了”。
同时,基于自己的认识,他还提出了使用核武器的诸多规矩。虽然艾森豪威尔政府认为核武器和其他武器并没有什么不同,但是肯尼迪政府采纳了他的观点。
另外,谢林还曾在美国战争学院给军官们教授军事战略课程。由于他在军事战略方面所作出的理论贡献,哈特利与桑德勒在《国防经济学手册》第4页中写道:“1960年,以三本当代经典著作的问世为标志,国防经济学正式创立。……这三本著作是:查尔斯·希奇和罗兰·麦基恩的《核时代的国防经济学》,刘易斯·理查森的《军备与不安全》,托马斯·谢林的《冲突战略》。”
1988年美国经济学联合会将谢林评为“杰出资深会员”,给他的评语是:“谢林关于社会关系的理论以及他对该理论多方面的应用,源于他富有成效地将理论与实践相结合。他有着异于常人的天赋,这使得他能切实涉及到有着相同或不同利益的参与人的社会和经济状况的本质,并能具体而生动地把这种本质描述出来”。
为什么有些国家、团体和个人可以和平地解决冲突,而另一些国家、团体和个人却不断地被冲突困扰呢?
在说明他们的获奖理由时,约尔根·韦布尔说:“为什么有些国家、团体和个人可以和平地解决冲突,而另一些国家、团体和个人却不断地被冲突困扰呢?感谢奥曼和谢林的研究,为这一自古以来困扰我们的问题带来启迪。”
博弈论(Game Theory)是研究理性的人们在合作和冲突中如何决策和行动的理论,最初开始于策墨洛(1913年)、波雷尔(1921年)和约翰·冯·诺伊曼(1928年)的研究工作。1944年,数学家约翰·冯·诺伊曼和经济学家奥斯卡·摩根斯坦合著了伟大的奠基性著作 《博弈论与经济行为》 ,概括了经济主体的典型行为特征,提出了策略型与广义型等基本博弈模型、解的概念和主要分析方法,全面奠定了作为当代经济学研究前沿的博弈论的理论基础。
按照博弈参与方的相互合作与否,博弈论可以划分为合作博弈与非合作博弈两大研究领域。1994年纳什(John Nash)、泽尔滕(Reinhard Selten)、海萨尼(JohnHarsanyi)凭借在非合作博弈方面的均衡分析方面做出的开创性的贡献,一起率先获得了当年诺贝尔经济学奖。这次奥曼和谢林作为博弈论学者再获殊荣,则归功于他们在合作博弈方面做出的出色研究与巧妙应用。
当年得奖的纳什研究了什么
比奥曼他们早11年得奖的纳什主要研究非合作博弈,即人们在不合作状态下是如何进行决策的。非合作博弈研究中最重要的概念之一就是纳什均衡。著名的囚徒困境问题(Prison’s Dilemma)可以说明纳什均衡这个所谓“完美均衡”的主要思想。
比如警方抓到了两个罪犯,但是警察对于他们的罪行了解得不是非常清楚。这时,如果他们都招供了,按照罪行他们每人会被判5年徒刑;如果都不招供,根据警方实际掌握的证据,只能每人判一年;但是如果其中一个人招供,另一个人不招供,则招供的人将被赦免不判刑,而拒不招供的人会被重判6年。
警方一开始就把这两个罪犯分开关押。这时,每个罪犯都会盘算,在招供和不招供的两个选择中,如果自己招供了,而对方还没有招供,那么自己可以被赦免不判刑。理性的他们都会选择招供。这样两个人都招供了,根据他们自己招供的罪行,两人都被判5年刑。
我们可以发现这两个聪明的罪犯,为了减轻对自己的处罚,从个人利益最大化出发,理性地选择了招供,而最终自作自受地把自己处于被判5年徒刑的糟糕结局中。那么他们当初的选择错了吗?为什么当初的如意算盘会落空!
按照纳什非合作博弈的观点,这两个罪犯最终的结果必然就是这种“聪明反被聪明误”的下场。
奥曼这次为什么会得奖
可是这种“聪明的错误”在现实世界中好像并不普遍,更多的情况是这两个罪犯都拒不招供,最终往往是警方根据掌握的证据只能使每个人被判一年徒刑。这是为什么呢?
按照奥曼的研究,对博弈当事人之间长期互动的性质进行考察后可以发现,博弈的不同阶段是相互依赖的,其结果是理性博弈当事人的决策不仅受到其过去经历的影响,而且还要受未来潜在可能性的影响。对于那两个罪犯而言,虽然可能在一些困境中大家会“聪明反被聪明误”。但是,在某一次选择中,双方都可能“慷慨”一次而“不自私”地选择不招供。他们事后却发现,最后的结果反而会比招供更好,这样在以后他们就很容易做出同时拒不招供的默契。
在现实生活中,这种适当“不理性”的“慷慨”而使得自己的利益增加的情况仿佛更多。这就是奥曼所研究的重复合作博弈的一个简单示意。
在诺贝尔经济学奖颁奖典礼上,颁奖嘉宾称颂奥曼,“罗伯特·奥曼是正式对所谓‘无限重复博弈’作全面分析的第一人。他的研究准确确认了倚赖于长期关系,一段时间内可以维持什么样的结果。”
在研究重复博弈中,奥曼提出了“强均衡”概念,即任何参与博弈的人都不可能通过单方面改变策略来增加其收益。对于那两个罪犯而言,他们都不可能通过招供使得自己的处罚变轻。
“公共地的悲剧”同样也可以说明他的思想。比如大家出海打鱼,竭泽而渔,鱼很快就会没有了。这时大家相互之间的矛盾冲突也很多,但是相互达成“捕鱼协议”的可能性也就更大了。
奥曼认为重复博弈是一个讨价还价的过程,为此他设计了一个讨价还价模型把最初当作外生变量的议价者之间的沟通与交流内生化。同时,他还在一般均衡分析、最优配置、非线性系统、控制论、测度理论、不动点理论等方面进行了大量的基础性研究,其成果被广泛应用于经济学、数学、运筹学等诸多领域。
20世纪80年代以后,博弈论研究取得了飞速进展,作为研究前沿在经济学领域中日益显贵。这不少都应该归功于奥曼的功劳。他所做那些基础性的研究工作,就博弈论的核心问题所进行的开创性研究,深刻地影响并推动了博弈论研究的发展。此外,他还培养了Hart、Kreps和Tauman等一大批优秀的经济学家。
目前奥曼任耶路撒冷希伯莱大学理性分析中心教授、纽约州立大学斯坦尼分校经济系和决策科学院教授、以色列数学俱乐部主席、美国经济联合会荣誉会员等。同时,他还担任《国际对策论》杂志(IJGT)、《数理经济学》杂志、《经济学理论》杂志、《运筹学数学》等多家学术刊物的编辑,并先后获得以色列颁发的科学技术哈维奖和经济学奖。
谢林运用博弈论分析了些什么
不同于奥曼运用数学进行了大量博弈论基础性理论研究工作,谢林更多地从经济学的角度应用博弈论理论来分析现实问题。本届诺贝尔评奖委员对他的评价是:“谢林,这位自称‘周游不定的经济学家’,被证明是一位非常杰出、具有开创性的探险者。”
谢林在谈到自己和奥曼之间的区别时也说到:“我把自己看成是博弈论的使用者,而不是博弈论学者,能跟罗伯特·奥曼这位真正的博弈论学者共同获此殊荣,我感到非常的荣幸。”
已经85岁高龄的谢林是目前获得诺贝尔经济学奖年纪最大的学者。他在1951年获得哈佛大学经济学博士学位,在哈佛大学肯尼迪政府学院担任政治经济学教授,执教长达20年,并获得退休名誉教授的称号。他还在美国马里兰大学公共政策学院和经济系担任教授。他教授的课程除包括经济学理论外,还涉及外交、国家安全、核战略以及军控等多个不同领域。他也是美国国家科学院和医学院的荣誉会员及艺术科学学院会员,并担任过美国经济学协会主席和东方经济学协会主席。获得过RAND政策分析研究生院荣誉博士、塞德曼政治经济学大奖和国家科学院奖。
谢林作为当代非主流经济学家的代表人物之一,对于事物的本质有一种深刻的洞察。他的学术思想超越了主流经济学的“理性人”假设,摒弃了用数学表示经济学理论的研究范式,创立并发展了“非数理博弈理论”,运用精炼的语言和各种小模型,将博弈论的思想巧妙地运用到了军备控制、恐怖主义与犯罪、能源环境政策与气候变化、种族隔离、供不应求市场的分析、谈判以及人群的相互行为等社会政治经济诸多领域。
他认为讨价还价是个非零和博弈,通过对该现象进行深刻剖析,提出了一个不同于一般常识的结论:“在讨价还价的过程中,势弱的一方通常会成为强者。” 当一方认为对方不会作出让步时,协议就达成了。一方之所以会让步,是因为他知道对方已经不可能让步了。因此,我们可以认为,谈判的秘诀在于让对方相信你不会再让步了。对此我们也可以这样理解,把自己放到不利的谈判地位反而是有利的,即破釜沉舟反而可以转败为胜。
谢林的卓越睿智突出地体现在他于1960年发表的《冲突战略》(The Strategy ofConflict)中运用博弈论对国家之间的讨价还价行为的分析。这本书也是国际关系领域最具有开创性的理论著作之一。书中他指出导致战争发生的原因是人们全面判断后的决定而不是偶然事件。如果一方坚信另一方会发动突然袭击,战争就会爆发;一方发动突然袭击的原因在于确信对方没有反击能力,因此防止突然袭击的办法是给对方显示自己具有还击的能力。他还认为,报复能力远比抵抗能力有用;具有不确定性的报复比可以确定的报复更具有威慑力。这些独到的见解都被事实证明是解决国家冲突问题的上上签。
他说“20世纪后50年最重要的一件事情是有一件事情没有发生”,这是基于他对于核战争问题的精辟研究。在他另一本同样具有重大影响的著作《武器与影响》中,谢林对军备控制进行了深入浅出的研究。他指出:最好的核武器分布是双方都有还击能力,即没有一方可以一次性摧毁对方的还击能力,和平的基础就来自双方都具有二次还击的能力。在分析稳定威慑问题时,他描述了一场西部牛仔决斗的场景,“如果双方都确定自己在临死之前能够进行有把握的准确还击,那么先开枪的一方将无任何优势而言,这样也就无需害怕对方先开枪了”。
同时,基于自己的认识,他还提出了使用核武器的诸多规矩。虽然艾森豪威尔政府认为核武器和其他武器并没有什么不同,但是肯尼迪政府采纳了他的观点。
另外,谢林还曾在美国战争学院给军官们教授军事战略课程。由于他在军事战略方面所作出的理论贡献,哈特利与桑德勒在《国防经济学手册》第4页中写道:“1960年,以三本当代经典著作的问世为标志,国防经济学正式创立。……这三本著作是:查尔斯·希奇和罗兰·麦基恩的《核时代的国防经济学》,刘易斯·理查森的《军备与不安全》,托马斯·谢林的《冲突战略》。”
1988年美国经济学联合会将谢林评为“杰出资深会员”,给他的评语是:“谢林关于社会关系的理论以及他对该理论多方面的应用,源于他富有成效地将理论与实践相结合。他有着异于常人的天赋,这使得他能切实涉及到有着相同或不同利益的参与人的社会和经济状况的本质,并能具体而生动地把这种本质描述出来”。