论文部分内容阅读
在一场关乎人与机器、人工智能乃至人类未来命运的“人机大战”中,代表人类出战的韩国著名棋手、最近十年世界冠军头衔最多者李世石不敌谷歌人工智能系统AlphaGo(阿尔法狗),当胜败尘埃落定时,更多注意力被放到了“AlphaGo靠什么击败李世石”这个问题上,相比用穷举法暴力破解而战胜卡斯帕罗夫的深蓝,拥有自主深度学习进化的AlphaGo显然更让世人震惊。
全球关注的人机世纪之战
人们总是对未知领域充满了好奇与敬畏,从计算机诞生之日起,各种有关人工智能的猜想便从终止过。人们一方面希望人工智能能够超越人类智慧,一方面又害怕被科技超越,矛盾的心态下,每一次以智慧为焦点的人机对战都会成为市场关注的焦点。
2016年3月9日至15日,被称为“世纪人机大战”的韩国棋手李世石VS谷歌围棋机器人AlphaGo的比赛最终以AlphaGo赢得四局落下帷幕,虽然本身关注和懂得围棋的人并不多,但这场人机世纪大战却通过各种渠道让全球亿万计的人们知道了—人类智慧被人工智能打败了!回顾以往的人机大战,人类并非永恒的胜者,美国IBM公司的“深蓝”超级计算机以2胜1负3平战胜了当时世界排名第一的国际象棋大师卡斯帕罗夫,但绝大多数人却不以为意,除十分接近的胜败结果外,深蓝主要是依靠运算能力穷举所有路数来选择最佳策略,它当时可以实现每秒两亿步的运算。很多人觉得卡斯帕罗夫的落败与体力有关,深蓝的策略多少有些“无赖”。
但AlphaGo却在“深蓝”获胜十九年后的今天,拥有自主深度学习进化的AlphaGo以难以让人争议的过程和结果,在围棋这一人类智慧竞技的高地上战胜了韩国棋手李世石。
让电脑拥有棋感的走棋网络
走棋网络把当前局面作为输入,预测/采样下一步的走棋。它的预测不只给出最强的一手,而是对棋盘上所有可能的下一着给一个分数。棋盘上有361个点,它就给出361个数,好招的分数比坏招要高。以往的科技只是单纯基于规则或者基于局部形状,利用简单的线性分类器训练完成走子,整个过程是不可能形成类似人类围棋选手的棋感。
AlphaGo去利用更高效的、宽度为192的网络(正常棋盘上有361个点,电脑给出361个数,好招的分数比坏招要高。),下出有最高置信度的落子。这样的做法一点也没有做搜索,但是大局观非常强,不会陷入局部战斗中,说它建模了“棋感”一点也没有错。但是走棋网络会不顾大小无谓争劫,会无谓脱先,不顾局部死活,对杀出错等等,更多像是高手凭借“自觉”在下棋,因而需要加入搜索功能,让电脑做出有价值的判断。
追求效率的快速走子
作为人类智慧竞技的高地,围棋用用天文数字般的局面数,走棋网络能让AlphaGo达到3毫秒的下子速度,但想要进一步提高AlphaGo的“反应”及“思考”能力,就需要快速走子系统的帮助了。
利用传统的局部特征匹配(local pattern matching)加线性回归(logisticregression)的方法,AlphaGo在吸纳了众多高手对局之后就具备了用梯度下降法自动调参的能力,从而实现了2微秒的走子速度和24.2%的走子准确率。24.2%的意思是说它的最好预测和围棋高手的下子有0.242的概率是重合的,相比之下,走棋网络在GPU上用2毫秒能达到57%的准确率。在AlphaGo有了快速走子之后,不需要走棋网络和估值网络,不借助任何深度学习和GPU的帮助,不使用增强学习,在单机上就已经达到非常高的水平了。
锦上添花的估值网络
估值网络对盘面的评估应用上同快速走子有些重叠,都是通过模拟落子得分评估当前及后面布局的优劣,但通过估值网络和快速走子的互补,在复杂的死活或对杀时,也就是进行到中盘阶段的时候,估值网络的重要性就会得到提升。前面提到AlphaGo能够提前30分钟知道自己必胜,估值网络就起到了很大的作用。
人类在下围棋时,通常会经历常识-棋感-计算-判断四个过程,AlphaGo的常识源于其“监督学习的策略网络(Policy Network)”带来的深层学习能力,而棋感和计算则需要深度神经网络同蒙特卡洛算法的融合,两者的融合让AlphaGo整个运作方式更接近人类。通过对比使用蛮力计算的“深蓝”眼中的国际象棋落子思路和AlphaGo眼中的围棋落子思路会发现,围棋的复杂度需要更“聪明”的AI才能完成了。 两个大脑加上深度神经网络,AlphaGo以Value networks来评估大量的选点,而以Policy networks来选择落子,并且开发了一种新式算法来结合蒙特卡洛算法和以上两个神经网络。在这种结合下,研究者们结合参考人类职业对局的监督式学习,和AI大量积累自对弈实现的深度学习,来训练和提高AI的围棋实力。
AI的进步与期望
围棋代表了很多人工智能所面临的困难:具有挑战性的决策制定任务、难以破解的查找空间问题和优化解决方案如此复杂以至于用一个策略或价值函数几乎无法直接得出。通过将策略和价值网络与树搜索结合起来,AlphaGo终于达到了专业围棋水准,让我们看到了希望:在其他看起来无法完成的领域中,AI也可以达到人类级别的表现。
当然,这一切都是建立在人类千年来在围棋领域积累上的,没有积累就不会围棋AI的今天。AlphaGo让世人看到了AI领域的巨大进步,但想要真正理解人类和语言,其还有一段很长的路要走。相比围棋,人类在生活上的行为习惯,需要AlphaGo们拥有更出色的学习能力以及判断能力,无论是存储容量还是搜索算法,都需要几何倍数的递增,从这个角度看,现在担心AlphaGo们拥有自己的意识或情感,都太早了一些。
渗透进入人们生后的AI
AlphaGo不是DeepMind惟一项目,也不是最大的项目。DeepMind的最终目标是智能助手、医疗和机器人。另外,尽管AlphaGo只是针对围棋开发的系统,但其原理可以被应用到现实问题中。以医疗为例,IBM已经依靠认知学习平台“Watson”进入了医疗领域,Watson在泰国和印度的两家医院协助医生诊断乳腺癌、肺癌和结肠直肠癌。尽管Watson自身不会诊断疾病,但它能够找到医生应该进一步认真检查的地方,并提出治疗方案。
而无人驾驶汽车其实也可以看做具备了身躯的AI,家喻户晓的特斯拉汽车便使用了基于深度学习的现有计算机视觉技术。当然,工业或者服务用机器人都是AI渗透进入人们生活的表现。AI公司们正在努力晚上其产品,争取能够无缝进入人们生活的各个领域,当AI设备在可靠性、适应性和灵活性等方面都有长足进步时,人们未来的生活也将变得更美好。
谷歌改变人类的野心
AlphaGo很强大很厉害,但对于近年来谷歌的谋划而言,AlphaGo无非是其在人工智能领域的小玩具而已。改组Alphabet的谷歌,疯狂地在全球收购各个尖端前沿领域的顶尖公司,把触角伸到了生命科学、人工智能、无人驾驶、虚拟现实等等许多的领域。AlphaGo背后的英国Deepmind公司,只是他们收购的许许多多家公司中的一个而已。
除了传统Youtube、Gmail和地图等等互联网业务,生命科学、人工智能、无人驾驶、虚拟现实等新领域其实谷歌并没有赚到什么钱,更多是对未来的投资和布局,但今天,AlphaGo的表现已经让我们看到了谷歌的投入回报,再加上众多具有颠覆性或者划时代意义的谷歌黑科技,让我们清楚看到了谷歌改变人类未来的野心。相比之下,国内BAT三大巨头在技术积淀和领域格局方面,就显得有些小气了。
人工智能的竞赛
在2010年到2015年期间,企业对人工智能创业公司的投资增长了15倍。BBC预测,人工智能市场将继续保持高速增长,2020年全球市场规模将达到183亿美元,约合人民币1190亿元。庞大的数据和潜力,足以让企业们疯狂。
在硅谷,截至2015年初就有超过1700家创业公司加入人工智能浪潮—这一数字过去1年还在不断增加之中。谷歌、Facebook、亚马逊等科技巨头们的巨大投入都推动AI整个领域取得巨大进步。图像识别、语音识别已经成为苹果、微软、Google、IBM等科技大公司激烈竞争的焦点,而在医疗识别、模拟大脑图像等细分领域中,也涌现出不少初创的科技企业。可以说,一场席卷全球的AI竞赛正在展开,谁能让科技变得更聪明,谁就有望在未来的竞争中占据有利位置。
写在最后:绝非取代
如同第一个工业革命中蒸汽机的出现取代蓝领工作一样,人类多个工种被人工智能最终取代也无法让人避免。但人工智能能够更精准、高效地帮助人们完成工作是肯定的,而人类那具有惟一性的大脑,未来的定位应该在创造!人类大脑和人工智能的合作,一定能共同推动整个人类社会的进步。
全球关注的人机世纪之战
人们总是对未知领域充满了好奇与敬畏,从计算机诞生之日起,各种有关人工智能的猜想便从终止过。人们一方面希望人工智能能够超越人类智慧,一方面又害怕被科技超越,矛盾的心态下,每一次以智慧为焦点的人机对战都会成为市场关注的焦点。
2016年3月9日至15日,被称为“世纪人机大战”的韩国棋手李世石VS谷歌围棋机器人AlphaGo的比赛最终以AlphaGo赢得四局落下帷幕,虽然本身关注和懂得围棋的人并不多,但这场人机世纪大战却通过各种渠道让全球亿万计的人们知道了—人类智慧被人工智能打败了!回顾以往的人机大战,人类并非永恒的胜者,美国IBM公司的“深蓝”超级计算机以2胜1负3平战胜了当时世界排名第一的国际象棋大师卡斯帕罗夫,但绝大多数人却不以为意,除十分接近的胜败结果外,深蓝主要是依靠运算能力穷举所有路数来选择最佳策略,它当时可以实现每秒两亿步的运算。很多人觉得卡斯帕罗夫的落败与体力有关,深蓝的策略多少有些“无赖”。
但AlphaGo却在“深蓝”获胜十九年后的今天,拥有自主深度学习进化的AlphaGo以难以让人争议的过程和结果,在围棋这一人类智慧竞技的高地上战胜了韩国棋手李世石。
让电脑拥有棋感的走棋网络
走棋网络把当前局面作为输入,预测/采样下一步的走棋。它的预测不只给出最强的一手,而是对棋盘上所有可能的下一着给一个分数。棋盘上有361个点,它就给出361个数,好招的分数比坏招要高。以往的科技只是单纯基于规则或者基于局部形状,利用简单的线性分类器训练完成走子,整个过程是不可能形成类似人类围棋选手的棋感。
AlphaGo去利用更高效的、宽度为192的网络(正常棋盘上有361个点,电脑给出361个数,好招的分数比坏招要高。),下出有最高置信度的落子。这样的做法一点也没有做搜索,但是大局观非常强,不会陷入局部战斗中,说它建模了“棋感”一点也没有错。但是走棋网络会不顾大小无谓争劫,会无谓脱先,不顾局部死活,对杀出错等等,更多像是高手凭借“自觉”在下棋,因而需要加入搜索功能,让电脑做出有价值的判断。
追求效率的快速走子
作为人类智慧竞技的高地,围棋用用天文数字般的局面数,走棋网络能让AlphaGo达到3毫秒的下子速度,但想要进一步提高AlphaGo的“反应”及“思考”能力,就需要快速走子系统的帮助了。
利用传统的局部特征匹配(local pattern matching)加线性回归(logisticregression)的方法,AlphaGo在吸纳了众多高手对局之后就具备了用梯度下降法自动调参的能力,从而实现了2微秒的走子速度和24.2%的走子准确率。24.2%的意思是说它的最好预测和围棋高手的下子有0.242的概率是重合的,相比之下,走棋网络在GPU上用2毫秒能达到57%的准确率。在AlphaGo有了快速走子之后,不需要走棋网络和估值网络,不借助任何深度学习和GPU的帮助,不使用增强学习,在单机上就已经达到非常高的水平了。
锦上添花的估值网络
估值网络对盘面的评估应用上同快速走子有些重叠,都是通过模拟落子得分评估当前及后面布局的优劣,但通过估值网络和快速走子的互补,在复杂的死活或对杀时,也就是进行到中盘阶段的时候,估值网络的重要性就会得到提升。前面提到AlphaGo能够提前30分钟知道自己必胜,估值网络就起到了很大的作用。
人类在下围棋时,通常会经历常识-棋感-计算-判断四个过程,AlphaGo的常识源于其“监督学习的策略网络(Policy Network)”带来的深层学习能力,而棋感和计算则需要深度神经网络同蒙特卡洛算法的融合,两者的融合让AlphaGo整个运作方式更接近人类。通过对比使用蛮力计算的“深蓝”眼中的国际象棋落子思路和AlphaGo眼中的围棋落子思路会发现,围棋的复杂度需要更“聪明”的AI才能完成了。 两个大脑加上深度神经网络,AlphaGo以Value networks来评估大量的选点,而以Policy networks来选择落子,并且开发了一种新式算法来结合蒙特卡洛算法和以上两个神经网络。在这种结合下,研究者们结合参考人类职业对局的监督式学习,和AI大量积累自对弈实现的深度学习,来训练和提高AI的围棋实力。
AI的进步与期望
围棋代表了很多人工智能所面临的困难:具有挑战性的决策制定任务、难以破解的查找空间问题和优化解决方案如此复杂以至于用一个策略或价值函数几乎无法直接得出。通过将策略和价值网络与树搜索结合起来,AlphaGo终于达到了专业围棋水准,让我们看到了希望:在其他看起来无法完成的领域中,AI也可以达到人类级别的表现。
当然,这一切都是建立在人类千年来在围棋领域积累上的,没有积累就不会围棋AI的今天。AlphaGo让世人看到了AI领域的巨大进步,但想要真正理解人类和语言,其还有一段很长的路要走。相比围棋,人类在生活上的行为习惯,需要AlphaGo们拥有更出色的学习能力以及判断能力,无论是存储容量还是搜索算法,都需要几何倍数的递增,从这个角度看,现在担心AlphaGo们拥有自己的意识或情感,都太早了一些。
渗透进入人们生后的AI
AlphaGo不是DeepMind惟一项目,也不是最大的项目。DeepMind的最终目标是智能助手、医疗和机器人。另外,尽管AlphaGo只是针对围棋开发的系统,但其原理可以被应用到现实问题中。以医疗为例,IBM已经依靠认知学习平台“Watson”进入了医疗领域,Watson在泰国和印度的两家医院协助医生诊断乳腺癌、肺癌和结肠直肠癌。尽管Watson自身不会诊断疾病,但它能够找到医生应该进一步认真检查的地方,并提出治疗方案。
而无人驾驶汽车其实也可以看做具备了身躯的AI,家喻户晓的特斯拉汽车便使用了基于深度学习的现有计算机视觉技术。当然,工业或者服务用机器人都是AI渗透进入人们生活的表现。AI公司们正在努力晚上其产品,争取能够无缝进入人们生活的各个领域,当AI设备在可靠性、适应性和灵活性等方面都有长足进步时,人们未来的生活也将变得更美好。
谷歌改变人类的野心
AlphaGo很强大很厉害,但对于近年来谷歌的谋划而言,AlphaGo无非是其在人工智能领域的小玩具而已。改组Alphabet的谷歌,疯狂地在全球收购各个尖端前沿领域的顶尖公司,把触角伸到了生命科学、人工智能、无人驾驶、虚拟现实等等许多的领域。AlphaGo背后的英国Deepmind公司,只是他们收购的许许多多家公司中的一个而已。
除了传统Youtube、Gmail和地图等等互联网业务,生命科学、人工智能、无人驾驶、虚拟现实等新领域其实谷歌并没有赚到什么钱,更多是对未来的投资和布局,但今天,AlphaGo的表现已经让我们看到了谷歌的投入回报,再加上众多具有颠覆性或者划时代意义的谷歌黑科技,让我们清楚看到了谷歌改变人类未来的野心。相比之下,国内BAT三大巨头在技术积淀和领域格局方面,就显得有些小气了。
人工智能的竞赛
在2010年到2015年期间,企业对人工智能创业公司的投资增长了15倍。BBC预测,人工智能市场将继续保持高速增长,2020年全球市场规模将达到183亿美元,约合人民币1190亿元。庞大的数据和潜力,足以让企业们疯狂。
在硅谷,截至2015年初就有超过1700家创业公司加入人工智能浪潮—这一数字过去1年还在不断增加之中。谷歌、Facebook、亚马逊等科技巨头们的巨大投入都推动AI整个领域取得巨大进步。图像识别、语音识别已经成为苹果、微软、Google、IBM等科技大公司激烈竞争的焦点,而在医疗识别、模拟大脑图像等细分领域中,也涌现出不少初创的科技企业。可以说,一场席卷全球的AI竞赛正在展开,谁能让科技变得更聪明,谁就有望在未来的竞争中占据有利位置。
写在最后:绝非取代
如同第一个工业革命中蒸汽机的出现取代蓝领工作一样,人类多个工种被人工智能最终取代也无法让人避免。但人工智能能够更精准、高效地帮助人们完成工作是肯定的,而人类那具有惟一性的大脑,未来的定位应该在创造!人类大脑和人工智能的合作,一定能共同推动整个人类社会的进步。