论文部分内容阅读
约翰·纳什,这位诺奖获得者、电影《美丽心灵》原型、世界级数学大师,意外逝世令世人震惊。纳什成名学术是“纳什均衡”,经济学家保罗·萨缪尔森说过一个冷笑话,“人们可以将一只鹦鹉训练成为经济学家,只要让它学会两个单词:需求与供给”。博弈论专家坎多尔对萨缪尔森的笑话加以补充,称“要成为现代经济学家,这只鹦鹉还必须学会一个单词,‘纳什均衡’”。纳什正是凭借纳什均衡理论获诺贝尔经济学奖,为何不是数学奖?因为诺贝尔根本没有数学奖,数学家只能在经济学或物理等旁支上开花。
纳什的故事之所以吸引人,正是因为他丰富的旁支人生成就。他的简历中,有军事战略学家的头衔,这与著名的兰德公司有很大关系。二战结束前夕美国空军创始人亨利·阿诺德上将提出《战后和下次大战时美国研究与发展计划》备忘录,要求利用民间学者和科学家,成立一个“独立的、介于官民之间的、进行客观分析的研究机构”,“以避免未来的国家灾祸,并赢得下次大战的胜利”。于是兰德公司在政府支持和道格拉斯飞机制造公司的投资下成立,专门为美国军方研究重大军事及国际政治战略问题。
早在二战时,美军就发现博弈论非常适合做军事决策。博弈论奠基人冯·诺依曼的学生梅里尔·弗劳特( “囚徒困境”发明者),曾在战争中利用博弈论为盟军制定轰炸策略,确保轰炸机被击落的概率最小。冯·诺依曼本人也受邀参与曼哈顿计划,并通过数学方法帮助盟军最终确定原子弹轰炸目标,广岛长崎的原爆其实是数学方法确定的。
冷战中美苏双方“核威慑”,使博弈论有了更广阔用武之地。兰德最初设立目的之一,就是让博弈论和军事运筹学更好地为美国军事及外交服务。兰德吸引了大量优秀数学家加入,纳什就是在这个时间点上,进入兰德工作。
1950年,在普林斯顿大学攻读博士学位的纳什,发表名为《非合作博弈》的博士论文。这篇论文并不被博弈论泰斗冯·诺依曼赏识。冯·诺依曼关注零和博弈, 即假定“所有对局者收益总和为零”。他的理论中,对一方是最优策略,一定会对其他至少一方不利。而纳什论文放弃这一假定,认为博弈中只要所有参与者可选择的策略有限,则必然存在一个平衡点,使得处在此点上的博弈参与者采取的策略,都对自己最优。在一定程度上否定了冯·诺依曼。
冯·诺依曼对此嗤之以鼻,纳什的师兄戴维·盖尔却认为纳什开创了新的博弈论流派,该论文最终发表,引起轰动。随后,纳什又发表《n人博弈中的均衡点》(1950)和《非合作博弈》(1951),对自己的博士论文进行深入阐述。这三篇论文的核心观点,被研究者概括为“纳什均衡”。
纳什在兰德时,其实并未对美军决策产生什么影响。当时,博弈论被军队应用在冷战对苏联的核战略。最初核战争追求对敌人彻底摧毁,更接近冯·诺依曼的“零和博弈”,纳什均衡并无用武之地。此外,由于性格和性取向的某些原因,纳什的工作成绩平平,同事普遍认为他不好打交道。与此同时纳什也失去对博弈论的兴趣,转而将精力投入到黎曼几何,于1951年夏进入麻省理工任教。
1958年,受雇于兰德的另一位数学家荷尔斯提出“恐怖的脆弱平衡理论”(The Delicate Balance of Terror),成为美国现代核威慑理论的奠基。他认为实施第一次核打击的战略价值(strategic value)要大于等待而准备第二次打击。理由是,影响战略对抗中双方决策的主要因素是到底要冒多大风险。一方核力量处于优势地位(譬如核弹头数量是50比10),如无法保证在对方第一轮打击中的生存概率,核力量的优势无法制止对方发动攻击,因为拥有10个弹头一方在第一次核打击中可能完全摧毁另一方的50个弹头,使得其第二次打击的力量被消灭。
根据这一理论,美军不仅要求空军的战略轰炸机24小时携带核武器在空中巡逻,而且开始发展核潜艇以提高在苏联第一次打击下的核武器生存概率。苏联也进行了同样的部署。结果美苏都发现,无论如何发展核力量,自己都没法保证在发动突袭式的核攻击中彻底摧毁对方全部核力量,从而制止对方发动核反击。
从此之后,至少美苏之间的核力量从零和博弈变成了非零和博弈,后来双方共同制定的各种限制核武器发展以及核力量透明化的谈判,正好符合纳什均衡所预言的状况。由此可见,纳什确实是个天才,尽管他在研究博弈论的时候并不知道他的理论将对世界有着如此巨大的影响。
纳什的故事之所以吸引人,正是因为他丰富的旁支人生成就。他的简历中,有军事战略学家的头衔,这与著名的兰德公司有很大关系。二战结束前夕美国空军创始人亨利·阿诺德上将提出《战后和下次大战时美国研究与发展计划》备忘录,要求利用民间学者和科学家,成立一个“独立的、介于官民之间的、进行客观分析的研究机构”,“以避免未来的国家灾祸,并赢得下次大战的胜利”。于是兰德公司在政府支持和道格拉斯飞机制造公司的投资下成立,专门为美国军方研究重大军事及国际政治战略问题。
早在二战时,美军就发现博弈论非常适合做军事决策。博弈论奠基人冯·诺依曼的学生梅里尔·弗劳特( “囚徒困境”发明者),曾在战争中利用博弈论为盟军制定轰炸策略,确保轰炸机被击落的概率最小。冯·诺依曼本人也受邀参与曼哈顿计划,并通过数学方法帮助盟军最终确定原子弹轰炸目标,广岛长崎的原爆其实是数学方法确定的。
冷战中美苏双方“核威慑”,使博弈论有了更广阔用武之地。兰德最初设立目的之一,就是让博弈论和军事运筹学更好地为美国军事及外交服务。兰德吸引了大量优秀数学家加入,纳什就是在这个时间点上,进入兰德工作。
1950年,在普林斯顿大学攻读博士学位的纳什,发表名为《非合作博弈》的博士论文。这篇论文并不被博弈论泰斗冯·诺依曼赏识。冯·诺依曼关注零和博弈, 即假定“所有对局者收益总和为零”。他的理论中,对一方是最优策略,一定会对其他至少一方不利。而纳什论文放弃这一假定,认为博弈中只要所有参与者可选择的策略有限,则必然存在一个平衡点,使得处在此点上的博弈参与者采取的策略,都对自己最优。在一定程度上否定了冯·诺依曼。
冯·诺依曼对此嗤之以鼻,纳什的师兄戴维·盖尔却认为纳什开创了新的博弈论流派,该论文最终发表,引起轰动。随后,纳什又发表《n人博弈中的均衡点》(1950)和《非合作博弈》(1951),对自己的博士论文进行深入阐述。这三篇论文的核心观点,被研究者概括为“纳什均衡”。
纳什在兰德时,其实并未对美军决策产生什么影响。当时,博弈论被军队应用在冷战对苏联的核战略。最初核战争追求对敌人彻底摧毁,更接近冯·诺依曼的“零和博弈”,纳什均衡并无用武之地。此外,由于性格和性取向的某些原因,纳什的工作成绩平平,同事普遍认为他不好打交道。与此同时纳什也失去对博弈论的兴趣,转而将精力投入到黎曼几何,于1951年夏进入麻省理工任教。
1958年,受雇于兰德的另一位数学家荷尔斯提出“恐怖的脆弱平衡理论”(The Delicate Balance of Terror),成为美国现代核威慑理论的奠基。他认为实施第一次核打击的战略价值(strategic value)要大于等待而准备第二次打击。理由是,影响战略对抗中双方决策的主要因素是到底要冒多大风险。一方核力量处于优势地位(譬如核弹头数量是50比10),如无法保证在对方第一轮打击中的生存概率,核力量的优势无法制止对方发动攻击,因为拥有10个弹头一方在第一次核打击中可能完全摧毁另一方的50个弹头,使得其第二次打击的力量被消灭。
根据这一理论,美军不仅要求空军的战略轰炸机24小时携带核武器在空中巡逻,而且开始发展核潜艇以提高在苏联第一次打击下的核武器生存概率。苏联也进行了同样的部署。结果美苏都发现,无论如何发展核力量,自己都没法保证在发动突袭式的核攻击中彻底摧毁对方全部核力量,从而制止对方发动核反击。
从此之后,至少美苏之间的核力量从零和博弈变成了非零和博弈,后来双方共同制定的各种限制核武器发展以及核力量透明化的谈判,正好符合纳什均衡所预言的状况。由此可见,纳什确实是个天才,尽管他在研究博弈论的时候并不知道他的理论将对世界有着如此巨大的影响。