论文部分内容阅读
柯洁赢了。
6月7日下午,柯洁在中国棋院四楼天元围棋演播室战胜连笑,拿下中国龙星战冠军,也守住了他最为看重的中国围棋等级分第一人的王座。
此役之前,连笑手握天元、名人两大头衔战冠军,与柯洁的等级分仅差三分。这也是三年来柯洁第一次面对真正的挑战,自2015年9月超过当时排名第一的时越,坐上江湖头把交椅后,还没有人如此接近过他。去年岁末韩国棋手朴廷桓从柯洁手中抢走了世界排名第一,柯洁却表示自己早就说过那个榜单并非官方排名,自己看重的还是国内等级分第一。
大比分2比1战胜好友连笑,柯洁连续33个月领跑中国等级分排行榜。年轻棋王靠智慧与勇力打下的江山似乎依然稳固。
然而离开对局室,只往下走一个楼层,江山就变了颜色——国产围棋AI“绝艺”端坐为王,成为国家队训练的重要辅助手段。
柯洁与连笑对决时,国手们正在用绝艺复盘训练。“这个阶段不太好过,你再怎么练,前面有一个你永远无法达到的目标,AI一直比你更强。”范胤七段4月在第15届倡棋杯锦标赛第二轮淘汰了柯洁,但他最近的心情却不是太好,“现在是AI的时代,比的是谁适应AI,使用AI,在自己身上结合得更快更好。”他指着身旁刚刚升七段的陶欣然说,“他们都适应得比我好,都长棋了,我适应得不够快,有点儿吃亏……”
6月7日还有一个消息在著名网络围棋对弈平台“野狐”上引爆,韩国职业棋手洪性志因“使用AI外挂被封号”——十年前洪性志击败李世石,晋升为七段,巅峰期刚过的李昌镐也曾四次败在他手下。这一次他在围棋江湖掀动风云是因为在野狐上不可思议的17连胜,连柯洁都被他杀得十分郁闷。
网络围棋是真正的围棋江湖,各路神仙相会于此,柯洁说自己从小到大,网棋下了不下两万盘。
AlphaGo、绝艺、金毛、星阵这些围棋AI都是从这里起步,向金帽子(世界冠军)银帽子(全国冠军)发起挑战,以不可思议的连胜完成自己的“成人礼”,从此在江湖立下名号。
使用AI下棋被网友戏称为“遛狗”,古力惊叹,“这对各方伤害太大了,职业棋手也要辅助下棋的话,以后谁敢在网上下?网络围棋改革刻不容缓了。”
“闲看数招烂樵柯,涧草山花一刹那。五百年来棋一局,仙家岁月也无多。”那个宁静悠长、时间仿佛凝滞不动的围棋世界,现在已经被挂在线上,随时被更新升级。“现在的棋跟从前已经是两种棋了,”国家队总教练俞斌说AI已经完全改变了职业棋手的行棋风格,“排名在前三四十名的棋手都受到了它的影响。”
“太快了,太快了”,李世石1比4不敌AlphaGo不过两年,柯洁泪洒乌镇也只有一年。中国围棋队领队华学明摁着太阳穴直摇头,“我原来一直认为AI进入围棋世界是利大于弊的,现在……我一看到‘点三三’就头疼,风格、美感、神秘感都没有了,一切都改变得太快!”
江山依旧,江湖已远。
如果不是研发围棋AI“星阵”,围棋水平仅有初学级别的计算机博士金涬恐怕一生也不会在正式比赛中与柯洁九段隔枰对坐。
为了当好星阵的“人肉臂”,比赛前一天他特地找人陪自己摆了两盘棋,“比赛时我下得很慢,主要是怕下错了,电脑给出位置后,我在棋盘上反复数,确认了位置才敢落子。如果因为我放错了子而输棋,就太对不起团队了。”
4月27日,柯洁在福州人机大赛上对阵“星阵”,这也是0比3痛负AlphaGo之后,时隔一年他第一次与AI面对面正式分先对弈。战至145手,柯洁投子认输,星阵赢得这场人机大战的胜利。
常昊九段接受本刊采访时说,在李世石、柯洁输给AI之后,“人机对抗的悬念已经结束了。”这场失利也在柯洁的预料之中,面对媒体,他很平静地说自己在中盘跟AI拼算力的时候,“力不从心”、“很无奈”。
去年5月输给AlphaGo后,柯洁曾说自己再也不想跟AI下棋了,但那显然只是一时血气。“在AI面前,尊严是什么?能吃吗?我只知道我喜欢下棋。我热爱围棋。”
好胜与热爱,给了他宝贵的“一口气”。乌镇人机大战之后,他对阵人类棋手连胜22场,一洗心中积郁。
当年7月,國产AI绝艺在野狐上以“绝艺指导棋”的名称,与强业余选手进行二到四子的让子棋对局,有几位职业棋手也受二子和绝艺对局。仿佛是要给人类棋手挣回尊严,7月17日柯洁表示,自己可以让职业棋手二子,当晚他与五位职业棋手对弈6局,3胜2负1和。
“职业棋手让不动业余高手二子”,这是围棋江湖上的一句老话。《围棋天地》杂志还在职业棋手中做过一个36问的调查,其中有个问题是“如果有一个围棋上帝,你觉得你和他的差距有多大?”棋手们答三子差距的居多,也有少数职业棋手认为围棋上帝也让不动自己二子。
“AlphaGo出现后我发现,围棋没有什么不可能。”柯洁在微博上跟古力互动说。
此后半年,即2018年1月17日晚8点半,柯洁自己也放下骄傲对战“绝艺”最强版,成为首位受让二子(黑贴六目半)与AI对弈的世界冠军。
古力在线上看到时,眼中一热,昔日的中国围棋一哥给比自己小14岁的小老弟叫了声“哥”,“一直想先去探探路,没想到某人勇气比我还大,厉害了我的‘哥’。” 本局仅弈77手,柯洁追杀白棋右上未果,爽快认输。一个小时后连笑九段跟进,鏖战247手后中盘告负。1月21日,“八冠王”古力也接受让子指导,“学习一盘”。
1月24日,柯洁终于赢了一盘,用他的话说,输了就被大肆报道,赢了,只能自己微博上通报一下,他在微博上贴出了自己写的长文章《职业棋手与人工智能的差距》,主动谈起AI,笑言两年前那个“把热血漫画主角套进现实中、那个极度中二的围棋少年”,如今虽然还没到油腻的年纪,却已经“油腻到可以放下尊严去向AI虚心讨教了”。
“其实聊这个话题的时候,我的内心是极其沉重的。AI到底给了我多大的伤害——它可是唯一一个在棋盘上把我杀哭的啊!”
他直言被AI让一手,“真的有一种说不出的滋味……苦楚?无奈?可我还是想去挑战。”他甚至不介意在AI发展到AlphaGo Zero那么强大时,去和AI下正式的让子棋(网上下的都是快棋,并且行棋相对随意,正式比赛慢棋更能代表棋手真正的水平),以此验证最强机器智能与最强人脑智能之间的差距到底有多大。
AlphaGo Zero是AlphaGo的最终最强版本,完全摈弃了人类棋手的经验,从零学起,从乱下到通杀此前两个版本,成为最强棋力的强AI,只用了40天。DeepMind方面在去年10月只发表了论文,没有再邀约人类棋手与之对阵,它与完胜柯洁的Master版本之间胜率为89比11。
机器学习的能力和效率如此强大,“人如果还有想要跟AI决胜的想法就太愚昧了,”棋圣聂卫平宣布,人机对抗已经结束,“从现在起,是人跟机器学习的阶段。”
《围棋天地》的编辑在福州报道柯洁与星阵AI对弈时,看到一幕触动人心的场景——
清早的研究室空空荡荡,76岁的林海峰找到人工智能“星阵围棋”的操作人,把55年前(1963年)他与恩师吴清源第一次在循环圈中交手的棋谱输入电脑,一步步观看人工智能的胜率评判,细致到每一个变化图都不错过。
星阵给出的招法不乏人工智能特色,有些颇为奇想天外。以讷于言著称的林海峰也不住地说,“原来还可以这样下”,“(这一步)我下得太差了。”整整一个上午,林海峰不顾高龄坐在棋盘前一步不动,宛如聆听大师智慧的学生。
“AlphaGo去年在乌镇说退出职业围棋江湖的时候,我还以为那只是说说,没想到此后真的再不出现了。”聂卫平九段摇着扇子说自己很想念这个横空出世的绝世高手。
AlphaGo去意甚坚,恰如DeepMind团队技术负责人David Silver所言,“AlphaGo已经退役了。这意味着我们在将人员和硬件资源转移到其他AI的问题中,还有很长的路要走。”离开围棋的日子,他们将这一智能程序所验证的机器学习和深度学习算法应用到了能源、医疗、环境保护等多个领域。
越过山丘,传奇退隐,围棋江湖被打破的平静却再也不能恢复如常。“我也不知道为什么又冒出了那么多AI?”聂卫平笑着说,“现在又冒出了好多‘狗’,在我心里‘阿尔法狗’是最厉害的,我想它可能找不到对手就去睡大觉了,我特别希望有一天它睡醒了,重出江湖,把这些狗狗都打败。”
在DeepMind 发表了《Mastering the game of Go without human knowledge(不靠人类知识掌握围棋)》的最新论文后,更多AI创业者闯入19×19的围棋棋盘。星阵围棋主创金涬坦言,“围棋的数据相对来讲比较好获得,棋谱都是公开资源,做围棋AI一来可以检验我们的算法锻炼团队,还可以快速获得知名度和影响力,帮助我们拓展其他的客户。”
站在巨人肩头,一个小的技术团队也有可能快速取得突破,柯洁输给星阵AI一个月后,世界排名第一的韩国棋手朴廷桓又败在天壤AI手上。
这两个AI都是小团队创业,天壤智能围棋从研发到跻身围棋AI列强只用了一年半,星阵的崛起更令人惊叹,它的前身是清华大学由小川教授研发的“神算子”,金涬博士和他的团队接手仅两个月,利用算法和模型的改变,迅速提升了棋力。与柯洁对阵前两周,星阵AI在弈城网上推出30局公测,并且“奉饶天下先”,让先接受职业高手的挑战。
对于这个名不见经传的“小AI”,对弈平台开始并没有信心,约定如果前五局有三局失利,则测试提前结束。不料这个棋风狠辣的“小AI”28胜2负,战绩惊人,“星阵”的名号也迅速在棋界叫响,聂卫平九段记不得其他AI的名字,但是说起“星阵”毫不陌生,“它下棋不退让。”
“不退让”是星阵围棋AI的标签,也是他们有意深耕于围棋产业的“技术诚意”。不到两年,国产围棋AI已经多得两只手数不过来,也都具备了挑战甚至击败职业九段的棋力,但其中多数都是将围棋AI作为技术实力展示的范例,对于深度嵌入围棋市场并没有太大热情——“我伤害了你却一笑而過”,职业棋手当为之一哭也。
与AlphaGo一脉相承的是,这些“狗狗”在优势局面下都会无端退让,由小川教授表示,“从对抗角度来看,能赢就是王道,但考虑到欣赏和指导层面的需求,人工智能有必要下出更容易让人理解的围棋,每步追求最优下法的围棋和能精确点目判断的围棋。”
星阵AI以不到AlphaGo 百分之一的计算资源,通过模型优化、改变训练方法,做出了一个“更接近围棋本质的AI”,“能赢100目,绝不赢99目。”
“虽然谷歌把它做到一个很高的水平,但是离破解这个游戏还很远很远,还有很多值得尝试的地方。作为一个人工智能或者深度学习算法的实验田来说,围棋游戏仍然是一个很好的实验方向。”金涬博士是国内较早从事云计算的专家。去年柯洁在乌镇下棋时,他从大公司辞了职,“自己的公司还没注册,也还在找方向。”人机大战是最好的AI公共教育,也掀起了AI创业、投资的风潮,他将谷歌的论文视为一条起跑线,大家都站在了这条线上,“在这个基础上,可以做出自己的东西。” 他说话非常慢,气质与职业棋手很相近。问及公司近两年的规划时,他说,“哦,两年,太长了!”见面两天后,我从网上看到消息,他们与有“魔鬼道场”之称的葛玉宏围棋道场签约,成为道场棋手日常训练和残酷的定级冲段赛的加速器。
以让子方式与柯洁等顶级职业棋手对弈的“绝艺”挑战赛版,也参考了AlphaGo Zero论文,并在实践中作出了改进,以老版本的绝艺为基础进行强化学习,自对弈了数百万局棋,在有限的资源和时间内,通过把强化学习和监督学习相结合来加速训练,快速提升了棋力。
2017年11月,这个版本正式公开前,以“符合预期”为名隐匿身份在网上横扫中日韩三国高手,39连胜时,被柯洁在第40盘以“模仿棋”阻止。棋手们一度怀疑AlphaGo重出江湖,直到第100盘,它将“绝艺如君天下少,闲人似我世间无”挂在自己的签名档上,并且选择了让两子与老版绝艺“手谈”,60连胜后公开身份,既展示了版本升级后强增两子棋力,也是在向2017年年初Master在线上的60连胜致敬。
当晚,在满屏打出的“666”,以及“柯洁与绝艺来盘经典的慢棋”的呼声中,有人打出一句,“各位,夜深了,洗洗睡去吧!”职业棋手心中况味复杂,王雷六段给《围棋天地》杂志写了篇《越过山丘》,“我从没想过自己追求一生的‘道’,被一个‘硅基生命体’轻易地破解。我无法接受的是要面对被破解的状态,我无法接受的是我目前的方向只能是学习,而不是探索。作为一个对于围棋内在逻辑有着强烈兴趣的人,我有很多很多不能接受。”
无论是否情愿,处于竞技围棋之巅的中韩国手都在这一年里拥抱了技术变革,争先恐后。
今年5月,韩国围棋小王子、18岁的申真谞在第23届GS杯决赛五番棋决胜局战胜李世石九段,获得了一个分量极重的国内冠军。接受韩国媒体采访时,他毫不讳言自己师从AI,“现在人工智能几乎否定了迄今所有的围棋理论,所以我们必须摈弃现有的围棋理论。以往的定式,只是表现那种条条框框的变化,而现在棋盘上没有什么是‘已经确定’的。无论中盘战斗还是布局,现在都是随机万变。”
韩国国家队研究室安装了ELF OpenGo,这个AI是Facebook团队参照论文对DeepMind技术的一个重现,由于韩国本土没有强围棋AI,韩国棋院积极配合Facebook AI团队,金志锡、申真谞、朴永训及崔哲瀚四位世界排名前30的选手都参与了ELF框架的测试改善,测试结果对外公布后,职业棋手们再次捂住胸口——AI每步限制50秒搜索时间,给人类棋手任意长时间思考,据称一些棋局下了三四个小时,结果AI仍然14比0完胜。
申真谞说自己每天至少要花五个小时以上和AI实战或者研究棋谱,“人工智能始终能下出闪光的一手棋,虽然无法完全理解透,但其思路能给你带来灵感。”
战绩起伏的柯洁则称自己在“重新学习围棋”。
“绝艺”4月底正式进入中国围棋队训练室,成为国家队训练专用AI,古力特意发了一条微博,“国家队的训练方式跟上了时代的步伐。”与腾讯方面的沟通都是华学明领队去谈的,拿到密码时,她召集总教练俞斌和女队教练王磊商议,国家队的凝聚力不能散,不能人人抱着台电脑,“密码我们拿着,棋手必须到训练室来使用AI,中国围棋队集体讨论的传统不能丢。”
“绝艺的作用很大,过去我们争论不休,谁也说服不了谁的局部,AI全部给出数字,这个是棋手最需要的,”俞斌教练把AI的使用比作“指路明灯”,他预言竞技围棋格局将发生变化,中国队有望真正与韩国拉开差距,而日本以及欧美“竞技围棋沙漠”有可能借助AI获得突破性提升,“韩国没有我们这么强的AI,技术上的支持和便利也不如我们。日本追不上中韩,但是如果AI用得好,他们的成绩可以快速提升,大赛进入16强或者32强不会那么困难了。”
对“道”的渴求,让职业棋手可以放下骄傲,在AI的帮助下接近“围棋上帝”,然而AI尚未穷尽棋道,上帝未来,撒旦先至。
前不久在浙江丽水举行的2018全国业余围棋公开赛上一位棋手疑似使用人工智能作弊,他将自己的手机一直放在上衣口袋、摄像头对准棋盘,爆冷战胜“业余天王”胡煜清8段后赛事方要求他收起手机,此后的比赛他不复神勇。
中国棋院早在2017年11月1日就颁布了《围棋职业比赛补充规定》,核心内容便是“鉴于围棋人工智能的发展速度”,职业棋手比赛中禁止携带、观看手机及其他电子设备,一经发现立即判负。“午休时间由一小时缩减为半小时,包括午休时间在内,对局棋手一律禁止回房间。如因特殊情况必须返回房间的,须有当值裁判陪同。”
柯洁此前曾经说过,职业棋手使用AI作弊的可能性较小,“圈子很小,这么做会让人看不起。”6月7日洪性志因“遛狗”被野狐封号之后,职业棋手之间的网上对弈也不安心了,当真是没有人知道你对面是不是坐着一只狗。
有专业人士预测,今后的职业大赛都将取消封盘制,拉通下。而日本围棋界的两日制对局势必退出江湖,“第一天比赛后,如果当局者利用AI来判断局势,寻找下一手最佳落点的话,对手还怎么下?”
“我们最开始学围棋的时候,都是日本风格,后来越来越竞技化,”谈及可能发生的变化以及无法预料的更多变化,华学明领队轻叹一声,“一切来得太快了!”
尽管跟华学明一样,看不得棋手不明所以地“点三三”,“像一阵流行感冒一样。”聂卫平还是以他一贯的乐观通达将AI的出现视为“围棋推广的福音”,但他也看到这一代棋手的艰难,“棋手要真正理解、消化AI的判断,形成自己的棋路,不容易,会是一条长路。”
旧有经验失效,自我价值动摇,在AI侵入围棋这个故事里,百味杂陈的不只是职业棋手,永远沉默永远面无表情的AlphaGo“人肉臂”黄士杰博士2017年11月在台湾出席人工智能研讨会,首度开腔,分享了在AlphaGo Zero版本的研发中,自己被强大的AI取代的感受——
DeepMind 把所有人类围棋知识抛弃掉,只给规则让它从头开始学。我回想起我在师大念博士班开发Erica围棋电脑程序,每天写程序、解Bug、做测试到半夜的日子,但AlphaGo Zero把我之前做的这些事全部取代,完全不需要我的协助。
于是有同事问我,AlphaGo Zero把你過去十几年在计算机上做的研究一点一点的拿掉,还远远超越你,你有什么感觉?一开始我心情有点复杂,但后来想想这是“趋势”。
如果我让 AlphaGo 有所阻碍的话,那我确实应该被拿掉,AlphaGo 99%的知识经我之手,它到达这一步其实是我从事计算机围棋研究的非常好的收尾,我已经非常满足了。
黄博士目睹AlphaGo Zero用了2000个TPU、自我训练了40天。第40天还没有到达其极限,“因为我们的机器要做其他事情就停下了,它还有很大的潜力。”
计算机专家吴军博士在《智能时代》中写道,“智能革命的结果是让计算机代替人去思考,或者说靠计算能够得到比人类思考更好的结果,能够更好地解决各种智能问题,这时,人类会突然发现自己还能做得比计算机更好的事情已经所剩不多了。”
我们持续跟踪报道职业棋手与AI相遇的故事,是因为对于其他专业领域而言,这个故事是样本也是镜鉴。
即便你是一个技术乐观派,赞同黄博士所言,“未来AI是人类的工具,跟人类合作,而非跟人类对抗。强人工智能还是Far Away,现在最强的学习技能仍在人类的脑袋里。”我们仍然要重新打量自己和所在的行业,技术席卷而至,我们能够持守的根基是什么?
(实习记者刘芮对本文亦有贡献)
6月7日下午,柯洁在中国棋院四楼天元围棋演播室战胜连笑,拿下中国龙星战冠军,也守住了他最为看重的中国围棋等级分第一人的王座。
此役之前,连笑手握天元、名人两大头衔战冠军,与柯洁的等级分仅差三分。这也是三年来柯洁第一次面对真正的挑战,自2015年9月超过当时排名第一的时越,坐上江湖头把交椅后,还没有人如此接近过他。去年岁末韩国棋手朴廷桓从柯洁手中抢走了世界排名第一,柯洁却表示自己早就说过那个榜单并非官方排名,自己看重的还是国内等级分第一。
大比分2比1战胜好友连笑,柯洁连续33个月领跑中国等级分排行榜。年轻棋王靠智慧与勇力打下的江山似乎依然稳固。
然而离开对局室,只往下走一个楼层,江山就变了颜色——国产围棋AI“绝艺”端坐为王,成为国家队训练的重要辅助手段。
柯洁与连笑对决时,国手们正在用绝艺复盘训练。“这个阶段不太好过,你再怎么练,前面有一个你永远无法达到的目标,AI一直比你更强。”范胤七段4月在第15届倡棋杯锦标赛第二轮淘汰了柯洁,但他最近的心情却不是太好,“现在是AI的时代,比的是谁适应AI,使用AI,在自己身上结合得更快更好。”他指着身旁刚刚升七段的陶欣然说,“他们都适应得比我好,都长棋了,我适应得不够快,有点儿吃亏……”
6月7日还有一个消息在著名网络围棋对弈平台“野狐”上引爆,韩国职业棋手洪性志因“使用AI外挂被封号”——十年前洪性志击败李世石,晋升为七段,巅峰期刚过的李昌镐也曾四次败在他手下。这一次他在围棋江湖掀动风云是因为在野狐上不可思议的17连胜,连柯洁都被他杀得十分郁闷。
网络围棋是真正的围棋江湖,各路神仙相会于此,柯洁说自己从小到大,网棋下了不下两万盘。
AlphaGo、绝艺、金毛、星阵这些围棋AI都是从这里起步,向金帽子(世界冠军)银帽子(全国冠军)发起挑战,以不可思议的连胜完成自己的“成人礼”,从此在江湖立下名号。
使用AI下棋被网友戏称为“遛狗”,古力惊叹,“这对各方伤害太大了,职业棋手也要辅助下棋的话,以后谁敢在网上下?网络围棋改革刻不容缓了。”
“闲看数招烂樵柯,涧草山花一刹那。五百年来棋一局,仙家岁月也无多。”那个宁静悠长、时间仿佛凝滞不动的围棋世界,现在已经被挂在线上,随时被更新升级。“现在的棋跟从前已经是两种棋了,”国家队总教练俞斌说AI已经完全改变了职业棋手的行棋风格,“排名在前三四十名的棋手都受到了它的影响。”
“太快了,太快了”,李世石1比4不敌AlphaGo不过两年,柯洁泪洒乌镇也只有一年。中国围棋队领队华学明摁着太阳穴直摇头,“我原来一直认为AI进入围棋世界是利大于弊的,现在……我一看到‘点三三’就头疼,风格、美感、神秘感都没有了,一切都改变得太快!”
江山依旧,江湖已远。
让子
如果不是研发围棋AI“星阵”,围棋水平仅有初学级别的计算机博士金涬恐怕一生也不会在正式比赛中与柯洁九段隔枰对坐。
为了当好星阵的“人肉臂”,比赛前一天他特地找人陪自己摆了两盘棋,“比赛时我下得很慢,主要是怕下错了,电脑给出位置后,我在棋盘上反复数,确认了位置才敢落子。如果因为我放错了子而输棋,就太对不起团队了。”
4月27日,柯洁在福州人机大赛上对阵“星阵”,这也是0比3痛负AlphaGo之后,时隔一年他第一次与AI面对面正式分先对弈。战至145手,柯洁投子认输,星阵赢得这场人机大战的胜利。
常昊九段接受本刊采访时说,在李世石、柯洁输给AI之后,“人机对抗的悬念已经结束了。”这场失利也在柯洁的预料之中,面对媒体,他很平静地说自己在中盘跟AI拼算力的时候,“力不从心”、“很无奈”。
去年5月输给AlphaGo后,柯洁曾说自己再也不想跟AI下棋了,但那显然只是一时血气。“在AI面前,尊严是什么?能吃吗?我只知道我喜欢下棋。我热爱围棋。”
好胜与热爱,给了他宝贵的“一口气”。乌镇人机大战之后,他对阵人类棋手连胜22场,一洗心中积郁。
当年7月,國产AI绝艺在野狐上以“绝艺指导棋”的名称,与强业余选手进行二到四子的让子棋对局,有几位职业棋手也受二子和绝艺对局。仿佛是要给人类棋手挣回尊严,7月17日柯洁表示,自己可以让职业棋手二子,当晚他与五位职业棋手对弈6局,3胜2负1和。
“职业棋手让不动业余高手二子”,这是围棋江湖上的一句老话。《围棋天地》杂志还在职业棋手中做过一个36问的调查,其中有个问题是“如果有一个围棋上帝,你觉得你和他的差距有多大?”棋手们答三子差距的居多,也有少数职业棋手认为围棋上帝也让不动自己二子。
“AlphaGo出现后我发现,围棋没有什么不可能。”柯洁在微博上跟古力互动说。
此后半年,即2018年1月17日晚8点半,柯洁自己也放下骄傲对战“绝艺”最强版,成为首位受让二子(黑贴六目半)与AI对弈的世界冠军。
古力在线上看到时,眼中一热,昔日的中国围棋一哥给比自己小14岁的小老弟叫了声“哥”,“一直想先去探探路,没想到某人勇气比我还大,厉害了我的‘哥’。” 本局仅弈77手,柯洁追杀白棋右上未果,爽快认输。一个小时后连笑九段跟进,鏖战247手后中盘告负。1月21日,“八冠王”古力也接受让子指导,“学习一盘”。
1月24日,柯洁终于赢了一盘,用他的话说,输了就被大肆报道,赢了,只能自己微博上通报一下,他在微博上贴出了自己写的长文章《职业棋手与人工智能的差距》,主动谈起AI,笑言两年前那个“把热血漫画主角套进现实中、那个极度中二的围棋少年”,如今虽然还没到油腻的年纪,却已经“油腻到可以放下尊严去向AI虚心讨教了”。
“其实聊这个话题的时候,我的内心是极其沉重的。AI到底给了我多大的伤害——它可是唯一一个在棋盘上把我杀哭的啊!”
他直言被AI让一手,“真的有一种说不出的滋味……苦楚?无奈?可我还是想去挑战。”他甚至不介意在AI发展到AlphaGo Zero那么强大时,去和AI下正式的让子棋(网上下的都是快棋,并且行棋相对随意,正式比赛慢棋更能代表棋手真正的水平),以此验证最强机器智能与最强人脑智能之间的差距到底有多大。
AlphaGo Zero是AlphaGo的最终最强版本,完全摈弃了人类棋手的经验,从零学起,从乱下到通杀此前两个版本,成为最强棋力的强AI,只用了40天。DeepMind方面在去年10月只发表了论文,没有再邀约人类棋手与之对阵,它与完胜柯洁的Master版本之间胜率为89比11。
机器学习的能力和效率如此强大,“人如果还有想要跟AI决胜的想法就太愚昧了,”棋圣聂卫平宣布,人机对抗已经结束,“从现在起,是人跟机器学习的阶段。”
《围棋天地》的编辑在福州报道柯洁与星阵AI对弈时,看到一幕触动人心的场景——
清早的研究室空空荡荡,76岁的林海峰找到人工智能“星阵围棋”的操作人,把55年前(1963年)他与恩师吴清源第一次在循环圈中交手的棋谱输入电脑,一步步观看人工智能的胜率评判,细致到每一个变化图都不错过。
星阵给出的招法不乏人工智能特色,有些颇为奇想天外。以讷于言著称的林海峰也不住地说,“原来还可以这样下”,“(这一步)我下得太差了。”整整一个上午,林海峰不顾高龄坐在棋盘前一步不动,宛如聆听大师智慧的学生。
穷尽
“AlphaGo去年在乌镇说退出职业围棋江湖的时候,我还以为那只是说说,没想到此后真的再不出现了。”聂卫平九段摇着扇子说自己很想念这个横空出世的绝世高手。
AlphaGo去意甚坚,恰如DeepMind团队技术负责人David Silver所言,“AlphaGo已经退役了。这意味着我们在将人员和硬件资源转移到其他AI的问题中,还有很长的路要走。”离开围棋的日子,他们将这一智能程序所验证的机器学习和深度学习算法应用到了能源、医疗、环境保护等多个领域。
越过山丘,传奇退隐,围棋江湖被打破的平静却再也不能恢复如常。“我也不知道为什么又冒出了那么多AI?”聂卫平笑着说,“现在又冒出了好多‘狗’,在我心里‘阿尔法狗’是最厉害的,我想它可能找不到对手就去睡大觉了,我特别希望有一天它睡醒了,重出江湖,把这些狗狗都打败。”
在DeepMind 发表了《Mastering the game of Go without human knowledge(不靠人类知识掌握围棋)》的最新论文后,更多AI创业者闯入19×19的围棋棋盘。星阵围棋主创金涬坦言,“围棋的数据相对来讲比较好获得,棋谱都是公开资源,做围棋AI一来可以检验我们的算法锻炼团队,还可以快速获得知名度和影响力,帮助我们拓展其他的客户。”
站在巨人肩头,一个小的技术团队也有可能快速取得突破,柯洁输给星阵AI一个月后,世界排名第一的韩国棋手朴廷桓又败在天壤AI手上。
这两个AI都是小团队创业,天壤智能围棋从研发到跻身围棋AI列强只用了一年半,星阵的崛起更令人惊叹,它的前身是清华大学由小川教授研发的“神算子”,金涬博士和他的团队接手仅两个月,利用算法和模型的改变,迅速提升了棋力。与柯洁对阵前两周,星阵AI在弈城网上推出30局公测,并且“奉饶天下先”,让先接受职业高手的挑战。
对于这个名不见经传的“小AI”,对弈平台开始并没有信心,约定如果前五局有三局失利,则测试提前结束。不料这个棋风狠辣的“小AI”28胜2负,战绩惊人,“星阵”的名号也迅速在棋界叫响,聂卫平九段记不得其他AI的名字,但是说起“星阵”毫不陌生,“它下棋不退让。”
“不退让”是星阵围棋AI的标签,也是他们有意深耕于围棋产业的“技术诚意”。不到两年,国产围棋AI已经多得两只手数不过来,也都具备了挑战甚至击败职业九段的棋力,但其中多数都是将围棋AI作为技术实力展示的范例,对于深度嵌入围棋市场并没有太大热情——“我伤害了你却一笑而過”,职业棋手当为之一哭也。
与AlphaGo一脉相承的是,这些“狗狗”在优势局面下都会无端退让,由小川教授表示,“从对抗角度来看,能赢就是王道,但考虑到欣赏和指导层面的需求,人工智能有必要下出更容易让人理解的围棋,每步追求最优下法的围棋和能精确点目判断的围棋。”
星阵AI以不到AlphaGo 百分之一的计算资源,通过模型优化、改变训练方法,做出了一个“更接近围棋本质的AI”,“能赢100目,绝不赢99目。”
“虽然谷歌把它做到一个很高的水平,但是离破解这个游戏还很远很远,还有很多值得尝试的地方。作为一个人工智能或者深度学习算法的实验田来说,围棋游戏仍然是一个很好的实验方向。”金涬博士是国内较早从事云计算的专家。去年柯洁在乌镇下棋时,他从大公司辞了职,“自己的公司还没注册,也还在找方向。”人机大战是最好的AI公共教育,也掀起了AI创业、投资的风潮,他将谷歌的论文视为一条起跑线,大家都站在了这条线上,“在这个基础上,可以做出自己的东西。” 他说话非常慢,气质与职业棋手很相近。问及公司近两年的规划时,他说,“哦,两年,太长了!”见面两天后,我从网上看到消息,他们与有“魔鬼道场”之称的葛玉宏围棋道场签约,成为道场棋手日常训练和残酷的定级冲段赛的加速器。
以让子方式与柯洁等顶级职业棋手对弈的“绝艺”挑战赛版,也参考了AlphaGo Zero论文,并在实践中作出了改进,以老版本的绝艺为基础进行强化学习,自对弈了数百万局棋,在有限的资源和时间内,通过把强化学习和监督学习相结合来加速训练,快速提升了棋力。
2017年11月,这个版本正式公开前,以“符合预期”为名隐匿身份在网上横扫中日韩三国高手,39连胜时,被柯洁在第40盘以“模仿棋”阻止。棋手们一度怀疑AlphaGo重出江湖,直到第100盘,它将“绝艺如君天下少,闲人似我世间无”挂在自己的签名档上,并且选择了让两子与老版绝艺“手谈”,60连胜后公开身份,既展示了版本升级后强增两子棋力,也是在向2017年年初Master在线上的60连胜致敬。
当晚,在满屏打出的“666”,以及“柯洁与绝艺来盘经典的慢棋”的呼声中,有人打出一句,“各位,夜深了,洗洗睡去吧!”职业棋手心中况味复杂,王雷六段给《围棋天地》杂志写了篇《越过山丘》,“我从没想过自己追求一生的‘道’,被一个‘硅基生命体’轻易地破解。我无法接受的是要面对被破解的状态,我无法接受的是我目前的方向只能是学习,而不是探索。作为一个对于围棋内在逻辑有着强烈兴趣的人,我有很多很多不能接受。”
乱局
无论是否情愿,处于竞技围棋之巅的中韩国手都在这一年里拥抱了技术变革,争先恐后。
今年5月,韩国围棋小王子、18岁的申真谞在第23届GS杯决赛五番棋决胜局战胜李世石九段,获得了一个分量极重的国内冠军。接受韩国媒体采访时,他毫不讳言自己师从AI,“现在人工智能几乎否定了迄今所有的围棋理论,所以我们必须摈弃现有的围棋理论。以往的定式,只是表现那种条条框框的变化,而现在棋盘上没有什么是‘已经确定’的。无论中盘战斗还是布局,现在都是随机万变。”
韩国国家队研究室安装了ELF OpenGo,这个AI是Facebook团队参照论文对DeepMind技术的一个重现,由于韩国本土没有强围棋AI,韩国棋院积极配合Facebook AI团队,金志锡、申真谞、朴永训及崔哲瀚四位世界排名前30的选手都参与了ELF框架的测试改善,测试结果对外公布后,职业棋手们再次捂住胸口——AI每步限制50秒搜索时间,给人类棋手任意长时间思考,据称一些棋局下了三四个小时,结果AI仍然14比0完胜。
申真谞说自己每天至少要花五个小时以上和AI实战或者研究棋谱,“人工智能始终能下出闪光的一手棋,虽然无法完全理解透,但其思路能给你带来灵感。”
战绩起伏的柯洁则称自己在“重新学习围棋”。
“绝艺”4月底正式进入中国围棋队训练室,成为国家队训练专用AI,古力特意发了一条微博,“国家队的训练方式跟上了时代的步伐。”与腾讯方面的沟通都是华学明领队去谈的,拿到密码时,她召集总教练俞斌和女队教练王磊商议,国家队的凝聚力不能散,不能人人抱着台电脑,“密码我们拿着,棋手必须到训练室来使用AI,中国围棋队集体讨论的传统不能丢。”
“绝艺的作用很大,过去我们争论不休,谁也说服不了谁的局部,AI全部给出数字,这个是棋手最需要的,”俞斌教练把AI的使用比作“指路明灯”,他预言竞技围棋格局将发生变化,中国队有望真正与韩国拉开差距,而日本以及欧美“竞技围棋沙漠”有可能借助AI获得突破性提升,“韩国没有我们这么强的AI,技术上的支持和便利也不如我们。日本追不上中韩,但是如果AI用得好,他们的成绩可以快速提升,大赛进入16强或者32强不会那么困难了。”
对“道”的渴求,让职业棋手可以放下骄傲,在AI的帮助下接近“围棋上帝”,然而AI尚未穷尽棋道,上帝未来,撒旦先至。
前不久在浙江丽水举行的2018全国业余围棋公开赛上一位棋手疑似使用人工智能作弊,他将自己的手机一直放在上衣口袋、摄像头对准棋盘,爆冷战胜“业余天王”胡煜清8段后赛事方要求他收起手机,此后的比赛他不复神勇。
中国棋院早在2017年11月1日就颁布了《围棋职业比赛补充规定》,核心内容便是“鉴于围棋人工智能的发展速度”,职业棋手比赛中禁止携带、观看手机及其他电子设备,一经发现立即判负。“午休时间由一小时缩减为半小时,包括午休时间在内,对局棋手一律禁止回房间。如因特殊情况必须返回房间的,须有当值裁判陪同。”
柯洁此前曾经说过,职业棋手使用AI作弊的可能性较小,“圈子很小,这么做会让人看不起。”6月7日洪性志因“遛狗”被野狐封号之后,职业棋手之间的网上对弈也不安心了,当真是没有人知道你对面是不是坐着一只狗。
有专业人士预测,今后的职业大赛都将取消封盘制,拉通下。而日本围棋界的两日制对局势必退出江湖,“第一天比赛后,如果当局者利用AI来判断局势,寻找下一手最佳落点的话,对手还怎么下?”
“我们最开始学围棋的时候,都是日本风格,后来越来越竞技化,”谈及可能发生的变化以及无法预料的更多变化,华学明领队轻叹一声,“一切来得太快了!”
尽管跟华学明一样,看不得棋手不明所以地“点三三”,“像一阵流行感冒一样。”聂卫平还是以他一贯的乐观通达将AI的出现视为“围棋推广的福音”,但他也看到这一代棋手的艰难,“棋手要真正理解、消化AI的判断,形成自己的棋路,不容易,会是一条长路。”
旧有经验失效,自我价值动摇,在AI侵入围棋这个故事里,百味杂陈的不只是职业棋手,永远沉默永远面无表情的AlphaGo“人肉臂”黄士杰博士2017年11月在台湾出席人工智能研讨会,首度开腔,分享了在AlphaGo Zero版本的研发中,自己被强大的AI取代的感受——
DeepMind 把所有人类围棋知识抛弃掉,只给规则让它从头开始学。我回想起我在师大念博士班开发Erica围棋电脑程序,每天写程序、解Bug、做测试到半夜的日子,但AlphaGo Zero把我之前做的这些事全部取代,完全不需要我的协助。
于是有同事问我,AlphaGo Zero把你過去十几年在计算机上做的研究一点一点的拿掉,还远远超越你,你有什么感觉?一开始我心情有点复杂,但后来想想这是“趋势”。
如果我让 AlphaGo 有所阻碍的话,那我确实应该被拿掉,AlphaGo 99%的知识经我之手,它到达这一步其实是我从事计算机围棋研究的非常好的收尾,我已经非常满足了。
黄博士目睹AlphaGo Zero用了2000个TPU、自我训练了40天。第40天还没有到达其极限,“因为我们的机器要做其他事情就停下了,它还有很大的潜力。”
计算机专家吴军博士在《智能时代》中写道,“智能革命的结果是让计算机代替人去思考,或者说靠计算能够得到比人类思考更好的结果,能够更好地解决各种智能问题,这时,人类会突然发现自己还能做得比计算机更好的事情已经所剩不多了。”
我们持续跟踪报道职业棋手与AI相遇的故事,是因为对于其他专业领域而言,这个故事是样本也是镜鉴。
即便你是一个技术乐观派,赞同黄博士所言,“未来AI是人类的工具,跟人类合作,而非跟人类对抗。强人工智能还是Far Away,现在最强的学习技能仍在人类的脑袋里。”我们仍然要重新打量自己和所在的行业,技术席卷而至,我们能够持守的根基是什么?
(实习记者刘芮对本文亦有贡献)