论文部分内容阅读
从两年前AI棋手击败李世石起,关于AI围棋的话题就没有断过。不少公司利用自有的计算资源开始研究AI围棋,并且带着自家AI围棋参加各种比赛。
今年7月末,“2018腾讯世界人工智能围棋大赛”总决赛在中国棋院举行。在这场比赛中,最终腾讯的AI围棋绝艺拔得头筹,获得40万元人民币奖金,这也是绝艺第三次夺得世界性AI围棋比赛冠军。
这次的比赛共有11支AI棋手队伍参加,其中4支来自中国,3支来自日本,一支来自比利时,一支来自美国。经过6月份的预选赛,剩下八支队伍进入决赛。经过7月29日的半决赛后,来自中国的绝艺、星阵,美国的ELFOpenGo,日本的AQ成功晋级总决赛。
在从预赛到决赛的比赛过程中,这些AI棋手不按套路出牌的对弈过程和意外情况,让观战的专业棋手也觉得惊讶。
在复赛中,绝艺对阵星阵,由于遇到了一个AI围棋中常见的“征子”bug,导致绝艺在极短的时间内就落败。
在绝艺对AQ的一场比赛中,开局不久绝艺就使用了尖顶招法,这种下法一般作攻击用,在人类资深选手的对弈中,几乎不会一开始就出尖顶,负责解说的九段棋手柯洁称:“这种棋小时候肯定会被老师骂俗手。”不过柯洁补充道,AI们动辄开局第五六手就尖顶,超出了人们长久以来的围棋认知,完全是一场技术革新。
在另一场绝艺對AQ的比赛中,绝艺执黑先落子,AQ则使出了模仿战术:不管绝艺先走到哪里,AQ就以围棋正中央为中心,下到与绝艺对称的点去。直到第147手,绝艺下到唯一的中心点上去,让AQ不能模仿,才结束了这一僵局,之后仅仅过了30手,AQ就落败。
在比赛中,作为解说员的资深棋手也在感叹,AI的学习能力太强。
有人问柯洁,这些AI棋手和人类棋手的差距有多大,柯洁表示:“AI们都是太厉害了,以前绝艺在野狐平台下过让二子棋,但因为有贴目,基本相当于让先,人类顶尖高手应该要好一些,但AI发展一日千里,以后随着它的发展,人类估计二子都够呛了。”很难想象去年还曾被AI棋手“虐”哭过的柯洁,现在会对AI有这么高的评价。
在决胜局的解说过程中,解说员四段棋手高星问九段棋手古力是否与AI交过手,古力回答说:“其实和AI学习还蛮多的,以前还爆冷赢过,当然那是AI刚出来的时候,但人工智能的发展太迅猛了,到后面就望尘莫及了。经常你看到胜利就在眼前,往往觉得还能下的时候,其实很可能已经不行了。经常是两步棋下完,AI的胜率就已经显示99%了,人工智能就是这么不可思议。”
为什么围棋对AI重要
围棋作为一种东方棋类,本来并不应该是西方科技研究者所能关注的领域,为什么能吸引到这么多AI团队深入这一领域?
这要从“深蓝”说起。1996年,IBM开发的国际象棋AI“深蓝”首次挑战国际象棋世界冠军卡斯帕罗夫,但被击败,许多人说AI并不能同人类相提并论。但第二年,经过改进的国际象棋AI“深蓝”再一次挑战卡斯帕罗夫,取得了胜利,在世界引起轰动。
但还有人对此并不担心,因为当时有一种观点是:围棋才是对弈过程最富变化的棋类,AI棋手不可能胜利。在国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;而围棋的每回合有250种可能,一盘棋可以长达150回合。若是用穷举法,恐怕没有谁想进行这么大数量级的穷举,而人类则可以凭借脑中对棋盘的理解来判断棋子的落脚点。
从这时起,在围棋上取得突破成为一些AI研究者的目标。AI棋手胜过人类,不仅是一个技术上的目标,更是对AI极限的探索。
这一目标在2016年初终于被实现。2016年初,《自然》杂志封面文章报道了谷歌Deepmind研究者开发的新围棋AI。这款名为“阿尔法狗”(AlphaGo)的人工智能在没有任何让子的情况下以5比0完胜职业围棋二段的樊麾,三个月后,阿尔法狗与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜,在世界引起轰动。与樊麾、李世石对弈的阿尔法狗结合了数百万人类围棋专家的棋谱,同时用强化学习的方法进行自我训练。
但此后的升级版本即使没有人类专家棋谱也能进行学习。阿尔法狗升级后的版本名为AlphaGoZero,也被称为阿尔法狗元。阿尔法狗元的能力在此前版本的基础上有了质的提升,研究团队不再向其提供人类棋谱进行学习,而是让它在棋盘上随意下棋,进行自我博弈,以自己下过的棋为经验。阿尔法狗元用了2000个TPU、自我训练了40天,到第40天还没有达到其极限。
阿尔法狗元的无师自通直观证明了AI拥有强大的学习能力。具备这样强大的学习能力的AI棋手,对人类有什么用?
AI围棋走向何方
目前人类段位最高的围棋等级是职业九段,而目前的AI已经击败了这个段位的棋手,并且实现了完全的自我学习。除了解决一些既定bug,再深入发展的空间并不大,所以不少AI棋手都选择了开源、退役,把代码提供给各个行业的人借鉴,退役的棋手包括曾经的风云AI棋手——阿尔法狗。
围棋在西方国家并不盛行,而在亚洲还有大量职业选手,AI棋手在亚洲则可以成为人类棋手的陪练,甚至于导师。
今年4月,绝艺就进入中国围棋队训练室,成为国家队训练专用AI。但这也不意味着人人都对着电脑训练,棋手要使用AI必须到训练室,必要的集体讨论还是要继续进行。
围棋教练俞斌曾对外表示:“绝艺的作用很大,过去我们争论不休,谁也说服不了谁的局部,AI全部给出数字,这个是棋手最需要的。”
今年7月末,“2018腾讯世界人工智能围棋大赛”总决赛在中国棋院举行。在这场比赛中,最终腾讯的AI围棋绝艺拔得头筹,获得40万元人民币奖金,这也是绝艺第三次夺得世界性AI围棋比赛冠军。
这次的比赛共有11支AI棋手队伍参加,其中4支来自中国,3支来自日本,一支来自比利时,一支来自美国。经过6月份的预选赛,剩下八支队伍进入决赛。经过7月29日的半决赛后,来自中国的绝艺、星阵,美国的ELFOpenGo,日本的AQ成功晋级总决赛。
在从预赛到决赛的比赛过程中,这些AI棋手不按套路出牌的对弈过程和意外情况,让观战的专业棋手也觉得惊讶。
在复赛中,绝艺对阵星阵,由于遇到了一个AI围棋中常见的“征子”bug,导致绝艺在极短的时间内就落败。
在绝艺对AQ的一场比赛中,开局不久绝艺就使用了尖顶招法,这种下法一般作攻击用,在人类资深选手的对弈中,几乎不会一开始就出尖顶,负责解说的九段棋手柯洁称:“这种棋小时候肯定会被老师骂俗手。”不过柯洁补充道,AI们动辄开局第五六手就尖顶,超出了人们长久以来的围棋认知,完全是一场技术革新。
在另一场绝艺對AQ的比赛中,绝艺执黑先落子,AQ则使出了模仿战术:不管绝艺先走到哪里,AQ就以围棋正中央为中心,下到与绝艺对称的点去。直到第147手,绝艺下到唯一的中心点上去,让AQ不能模仿,才结束了这一僵局,之后仅仅过了30手,AQ就落败。
在比赛中,作为解说员的资深棋手也在感叹,AI的学习能力太强。
有人问柯洁,这些AI棋手和人类棋手的差距有多大,柯洁表示:“AI们都是太厉害了,以前绝艺在野狐平台下过让二子棋,但因为有贴目,基本相当于让先,人类顶尖高手应该要好一些,但AI发展一日千里,以后随着它的发展,人类估计二子都够呛了。”很难想象去年还曾被AI棋手“虐”哭过的柯洁,现在会对AI有这么高的评价。
在决胜局的解说过程中,解说员四段棋手高星问九段棋手古力是否与AI交过手,古力回答说:“其实和AI学习还蛮多的,以前还爆冷赢过,当然那是AI刚出来的时候,但人工智能的发展太迅猛了,到后面就望尘莫及了。经常你看到胜利就在眼前,往往觉得还能下的时候,其实很可能已经不行了。经常是两步棋下完,AI的胜率就已经显示99%了,人工智能就是这么不可思议。”
为什么围棋对AI重要
围棋作为一种东方棋类,本来并不应该是西方科技研究者所能关注的领域,为什么能吸引到这么多AI团队深入这一领域?
这要从“深蓝”说起。1996年,IBM开发的国际象棋AI“深蓝”首次挑战国际象棋世界冠军卡斯帕罗夫,但被击败,许多人说AI并不能同人类相提并论。但第二年,经过改进的国际象棋AI“深蓝”再一次挑战卡斯帕罗夫,取得了胜利,在世界引起轰动。
但还有人对此并不担心,因为当时有一种观点是:围棋才是对弈过程最富变化的棋类,AI棋手不可能胜利。在国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;而围棋的每回合有250种可能,一盘棋可以长达150回合。若是用穷举法,恐怕没有谁想进行这么大数量级的穷举,而人类则可以凭借脑中对棋盘的理解来判断棋子的落脚点。
从这时起,在围棋上取得突破成为一些AI研究者的目标。AI棋手胜过人类,不仅是一个技术上的目标,更是对AI极限的探索。
这一目标在2016年初终于被实现。2016年初,《自然》杂志封面文章报道了谷歌Deepmind研究者开发的新围棋AI。这款名为“阿尔法狗”(AlphaGo)的人工智能在没有任何让子的情况下以5比0完胜职业围棋二段的樊麾,三个月后,阿尔法狗与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜,在世界引起轰动。与樊麾、李世石对弈的阿尔法狗结合了数百万人类围棋专家的棋谱,同时用强化学习的方法进行自我训练。
但此后的升级版本即使没有人类专家棋谱也能进行学习。阿尔法狗升级后的版本名为AlphaGoZero,也被称为阿尔法狗元。阿尔法狗元的能力在此前版本的基础上有了质的提升,研究团队不再向其提供人类棋谱进行学习,而是让它在棋盘上随意下棋,进行自我博弈,以自己下过的棋为经验。阿尔法狗元用了2000个TPU、自我训练了40天,到第40天还没有达到其极限。
阿尔法狗元的无师自通直观证明了AI拥有强大的学习能力。具备这样强大的学习能力的AI棋手,对人类有什么用?
AI围棋走向何方
目前人类段位最高的围棋等级是职业九段,而目前的AI已经击败了这个段位的棋手,并且实现了完全的自我学习。除了解决一些既定bug,再深入发展的空间并不大,所以不少AI棋手都选择了开源、退役,把代码提供给各个行业的人借鉴,退役的棋手包括曾经的风云AI棋手——阿尔法狗。
围棋在西方国家并不盛行,而在亚洲还有大量职业选手,AI棋手在亚洲则可以成为人类棋手的陪练,甚至于导师。
今年4月,绝艺就进入中国围棋队训练室,成为国家队训练专用AI。但这也不意味着人人都对着电脑训练,棋手要使用AI必须到训练室,必要的集体讨论还是要继续进行。
围棋教练俞斌曾对外表示:“绝艺的作用很大,过去我们争论不休,谁也说服不了谁的局部,AI全部给出数字,这个是棋手最需要的。”