AI上台,人类弃牌

来源 :看世界 | 被引量 : 0次 | 上传用户:xiaoyanmeimei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卡内基-梅隆大学的计算机科学教授桑德霍尔姆

  2017年的赌场锦标赛期间,一个名为Libratus的扑克游戏程序,在1.2万手双人扑克比赛中,巧妙地击败了4名职业选手。但该程序的联合创作者托马斯·桑德霍尔姆,并不认为人工智能可以在与更多的选手对阵时达到类似的表现。
  两年后,来自卡内基-梅隆大学的计算机科学教授桑德霍尔姆,证明了他自己是错的。桑德霍尔姆和他的合作伙伴,共同开发了一个名为Pluribus的人工智能程序,它可以在六人无限制扑克比赛中一直击败人类职业牌手。桑德霍尔姆说:“我一生中从未想过可以达成这个目标。”

多人决策


  过去,人工智能对人类的胜利,仅涉及两人或两队的对战比赛,如跳棋、国际象棋、围棋和双人无限制扑克。这些游戏都是零和游戏—游戏只有一个胜利方和一个失败方。但是,六人扑克则更接近现实生活,在这种情况下,一方必须在不了解多个对手的决策过程和资源的情况下,做出决定。
  脸书的人工智能研究科学家、Pluribus的联合创始人诺姆·布朗说:“这是我们第一次超越零和游戏这种常规模式。即使在通常情况下,人工智能也能做得很好。”
  Pluribus程序在与5名人类玩家对抗的比赛中,赢得了奖金。人类玩家来自15名扑克职业玩家组成的轮换阵容,他们中的每个人都在扑克锦标赛中赢得过至少100万美元的奖金。比赛历时12天,进行了超过1万手出牌。
  《科学》杂志上发表的一篇论文,详细介绍了这个成功案例。尽管Pluribus并未达到与Libratus以及另一个名为DeepStack的双人扑克程序一样高的胜率,但它的胜率仍然非常可观。“当机器人与人类坐在一起时,它赚了很多钱,”布朗说,“我当然会将其描述为‘超人’的表现。”

低耗模拟


  Pluribus首先要在许多模拟的扑克对局中与自己对抗,制定战略蓝图。
  Pluribus解决六人扑克游戏的重大突破,来自其“深度限制搜索功能”。该组件允许人工智能向前看几步,并根据对手可能的决定,为游戏的剩余部分找出更好的策略。
  许多其他的扑克游戏程序,也使用了类似的搜索功能,但为了六人扑克游戏这么做,需要动用极大的计算内存量:每个玩家持有的牌数,每个人认为其他玩家所拥有的手牌,以及随后的所有投注决定……这其中有太多场景需要模拟。
  Libratus只在最后四轮中的两轮投注里,使用搜索来克服运算瓶颈。该解决方案在仅有两个玩家的对局中,就需要使用100个CPU来处理数据。

  职业扑克选手通常认为进行“反主动下注”是一个错误,但是Pluribus却会频繁地使用这种手段。

  具体来说,在一场现场扑克游戏中,Pluribus是在一台只有2个中央CPU和128GB内存的机器上运行的。“它可以在没有图形处理单元和其他高端硬件的情况下运行。”桑德霍尔姆说。相比之下,DeepMind著名的AlphaGo程序,在2016年与顶级职业棋手李世石九段对决的围棋比赛中,使用了1920个CPU和280个GPU。
  Pluribus采用的深度限制搜索功能,考虑对手在基本投注策略中如何选择:有人偏向弃牌,有人偏向于叫牌,还有人偏向于加注。这个经过调整的搜索功能,有助于解释为什么Pluribus在六人扑克比赛中获得成功—需要的计算资源和内存相对最小。

用途多样


  卡内基-梅隆大学和脸书,计划制作Pluribus的伪代码(一种算法描述语言),详细解释该程序中的每个必要步骤,并与已发表的论文一起提供,以便其他人工智能研究人员可以重现这些效果。
  不过,该团队最后决定不发布该代码,因为它可能会促进人工智能扑克程序的传播,对在线扑克社区和扑克行业造成极大的破坏。
  而且,即使没有代码,人类也可以从人工智能的策略中学习。例如,职业扑克选手通常认为进行“反主动下注”是一个错误—上一轮进行了非积极投注之后,对新开始的一轮进行积极投注。但是Pluribus却会频繁地使用这种手段。
  除了扑克之外,该人工智能可以应用在人类没有充分了解或思考的任何场景中。这些领域可能包括网络安全、金融交易、商业谈判和竞价。桑德霍尔姆表示,这个人工智能甚至可以在2020年美国总统大选的党内初选中起作用:理论上来说,参与竞争的候选人可以从人工智能的建议中获益,这些建议包括只需花费恰好足够的广告资金在关键州获胜,充分利用有限的竞选资金。
  桑德霍尔姆创立了三家初创公司,包括战略机器和战略机器人公司,很可能会将这种人工智能融入为商业和军事客户提供的服务中。
  诺姆·布朗计划进一步探索人工智能如何適应更复杂的多人游戏场景。“多人扑克已经是最后一个里程碑了,”布朗说,“现在我们正在寻求将其应用扩展到扑克之外。”
其他文献
在如今一些东亚国家的网络语境下,声讨“田园女权”“伪女权”的声浪不断。  日本社会学学者上野千鹤子在《厌女》一书中提到,“厌女”同时来自男性和女性,男性蔑视女性,女性则自我厌恶。她从文学作品、社会事件、家庭关系等各方面,来分析日本社会的“厌女症”。在韩国,女星如果被认为大肆宣扬赋权女性,便会被公众和粉丝挞伐。  “女性主义”一词起源于19世纪的法国,但在近两个世纪,因被广泛使用而生成了不同意义。简
提及影视作品中的常客—黑帮、海盗、黑客、巫师以及警察—我们的脑海里有一种刻板印象—他们的职业隐秘,身份未明,离暴力血腥与光怪陆离很近,游离于道德和法律的边界,甚至与神力结合。  但如果把他们拉出灰色地带,另单讨论,会像万花筒被调为了另一个角度一样,呈现出令人讶异的面貌。  比如,那些臭名昭著的惡棍们,可能是时尚大帝、投资天才,甚至仿佛变成了正义大侠。他们的活动并非100%都是粗鲁的,但要注意,那也
土耳其首都安卡拉机场的名字叫“Esenbo?a”(音为艾叁博阿),这个词到底从何而来?  笔者一直在土耳其工作,算来在安卡拉时日不短,经安卡拉机场辗转于土耳其各个城市的机会也不少。一挥手,“先生哪里?”“Esenbo?a.”从没考虑过名字是什么意思。  一日,笔者和同事们经过机场,话题自然被引到了机场的名字上来。据说当地曾发生过一场大战,战争双方为奥斯曼土耳其人和蒙古人部队,战争结果以奥斯曼土耳其
3月11日,土耳其伊斯坦布尔,工作人员在科勒齐阿里帕夏清真寺内消毒  就在土耳其宣布了第一例新冠肺炎确诊病例时,我隐隐约约感觉到对门的邻居也生病了。  邻居是一对跨国小情侣:巴西男模和他的土耳其女友。平时他们一直玩高分贝音响,一夜之间突然安静了,但隔着墙壁能听到他们的咳嗽声。  正逢冬春交接,感冒的人多,起初我没有太在意,直到他们大吵了一架。模糊听到女孩说“我不想死”,男孩一边咳嗽一边说“我已经接
目前还不清楚有多少为伊朗而战的阿富汗人死在叙利亚,但今年5月,至少有200名 Fatemioun成员死亡  优厚月薪及居留许可  今年6月,Jehantab接到35岁的丈夫海德尔从伊朗首都德黑兰打来的电话:“我要去叙利亚了……我可能回不来了。很少有战士能从叙利亚残酷的冲突中活下来。”Jehantab带着3个年幼的孩子住在阿富汗首都喀布尔,她说海德尔是被伊朗当局许诺的月薪700美元以及居留许可所诱导
剧是剧,现实是现实,谁能不明白?  蔡小小最爱韩剧,入门即《天国的阶梯》。继母恶毒作梗,女主忍辱负重。没用呀,痴情男女灾祸不断,从眼疾失明,到不治之症,“第一集就很惨了,我陪着一把鼻涕一把泪”。  还有《蓝色生死恋》,苦命情侣和双双怨偶。她小时候,韩剧那时的套路即如此。  剧情“狗血”,韩剧及其受众一度被标签化。但蔡小小说,不是韩剧让人多愁善感,“而是看韩剧的人,本来就是感性的吧”。  后来,韩剧
在俄国诗坛,莱蒙托夫顶着“伟大诗人”的桂冠,名字常排在普希金之后。喜欢俄国文学的中国读者,无人不晓得莱蒙托夫。据说20世纪20-30年代我国就有了中譯本,我研读苏联文学时,读的是余振译的莱蒙托夫的诗歌,以及翟松年译的《当代英雄》。  人们在读莱蒙托夫作品的时候,即会感觉到他曾备受情感折磨。爱情对他而言,时而如“天国情愫之高尚”,时而若世俗情欲之猛烈。他爱过很多女人,给她们写过情诗。这些女人既千娇百
5月4日,美国纽约时报广场行人车辆稀少,液晶屏上显示新冠防控相关信息  新冠疫情不仅入侵人类细胞,也侵入城市肌理。停工停课以后,城市也像染了病毒的身体一样失去活力,冷清的街道仿佛“沉睡”了一般。  大城市作为经济动脉,它们的“面貌”喻示着一个国家的发展、民众的生活。如今,很多重灾区城市已经度过“疫情高峰期”,开始复工复学。人们的生活总算“前进”了一些,街区也随之重回熙熙攘攘。  美國在4月16日颁
唐纳德·特朗普会在什么地方度过就职典礼前夜?他会遵循传统选在布莱尔宫,还是选择更奢华的地方——比如以他的名字命名并且跟布莱尔宫只隔了几条街的奢华酒店?  比白宫更私密  过去40年中,美国历任候任总统都会在白宫对面的国宾馆度过就职典礼前夜。第二天早上,候任总统会在这栋历史名迹里与家人及朋友共进早餐,“就职日”由此拉开序幕。早餐之后,再去白宫与即将离任的总统及第一夫人开简会,接着前往国会大厦宣誓就职
杨安泽参加了7次向全国广播的初选辩论,在一夜之间成了美国政坛最有名的华裔面孔  纽约“上州”与纽约市迥然相异,大片大片的主要是乡野,几乎全被森林覆盖。这里纬度与中国东北相当,3月底时还是暮冬季节,日照时间尚短。早早降临的夜幕,难免给寒冷的天地蒙上一层怪异的氛围。然而,真正让杨安泽感到不安的,是站在食品店入口处的三个中年人。三人戴着连衣帽,凑在一起窃窃私语。其中一人抬起头来,皱着眉头瞪了他一眼。据杨