论文部分内容阅读
最近被各种社交媒体狂刷屏的事件大概要数李世石大战“阿尔法围棋”(AlphaGo)了。“阿尔法围棋”是谷歌公司研发的围棋程序。Go是“围棋”的意思,而Alpha则来自谷歌的母公司Alphabet(字母表)的名称。由此看来,谷歌在下一盘很大的棋,在“阿尔法围棋”之后还会推出一系列人工智能程序挑战人类智慧。
据“阿尔法围棋”研发者介绍,这款围棋程序包含两个“大脑”:一个是对每一步棋进行概率分析的“策略网络”,即“策略大脑”;另一个是进行全局判断的“价值网络”,即“价值大脑”。
其实,按照现有的科技发展规律,拥有“策略大脑”的计算机赢棋并不是很难。因为任何棋类游戏的落子位置是有限的,只要计算机的计算能力足够强大,用穷举法把每一步棋的位置变化都算出来,做到每下一步棋的赢棋概率接近甚至达到100%,这个拥有“策略大脑”的“阿尔法围棋”就可以成为当之无愧的世界第一棋王。和常人对决不同的是,人机对决的关键是前期的几手棋,人类棋手一旦前期出现失误,后期再怎么精于算计也赢不了机器。而且每名棋手前期的习惯走棋方式也是可以根据历史数据获取的,这些都大大降低了计算的难度。
“阿尔法围棋”的设计师透露,在挑战李世石之前,他们的内部测试概率就是5∶0完胜。这真的不见得是吹牛。1965年,英特尔公司创始人摩尔提出了“摩尔定律”,也就是当价格不变时,集成电路上的元器件数目每隔18?24个月便会增加一倍,性能也会提升一倍。如今,多核中央处理器的出现和云计算技术使计算机的整体运算速度仍然保持突飞猛进的发展。2015年10月,“阿尔法围棋”就以5∶0完胜欧洲围棋冠军、职业二段选手樊麾。
而这次人机大战最有意思的亮点其实是“阿尔法围棋”的“价值大脑”。1997年5月,当时IBM的超级电脑“深蓝”在经过六盘对决后,战胜了国际象棋世界冠军卡斯帕罗夫。“深蓝”当时只有一个“策略大脑”。而如今“阿尔法围棋”所拥有的“价值大脑”则会根据对局的需要做出“价值判断”。如果一步棋即便会对局部造成损失,但是对全局有价值,计算机也会加以判断后果断出招。例如“阿尔法围棋”对阵李世石第二局中的第37手黑棋,这步棋当时被看作是不顾自己左下角损失的“烂”棋,但却成为后来连聂卫平都要“脱帽致敬”的关键一步,体现出“阿尔法围棋”所具有的“价值判断”的威力。
不过,赢几盘棋显然并不是“阿尔法围棋”的终极目标。谷歌推出围棋程序的目的还是为了测试人工智能的程度。3月13日,李世石终于扳回一盘,表示“这一胜太有价值,我不会用任何东西来换”。在李世石看来,这盘赢棋的价值在于终于挽回了自己和人类的面子。而拥有“价值大脑”的“阿尔法围棋”凭借这盘输棋名正言顺地获得国际围棋排名的正式积分,成为世界排名第四的正式棋手,因为如果没有输棋记录将不会被记分。不管什么棋,本质上还是游戏。对于人类来说,真正的游戏不仅仅在于输赢,更在于给每一名参与者和旁观者带来快乐。从这点来看,能否熟练进行价值判断才是实现人工智能的关键。
早在古希腊,亚里士多德就提出“人是理性的动物”,也正是在得与失的价值判断中,人才产生了自我意识,并以此为出发点开始进行改造外部世界的科学实践。与之相应的则是感性,它是根据人的情感好恶对理性价值观的修订。理性与感性的共同作用构成了人类独有的智慧和价值体系。从这点来看,“阿尔法围棋”要想模拟人类的智慧,其实是非常困难的。机器人可以精确计算出自己的利益得失,甚至能掌握人类所具有的知识,却无法理解人类为崇高的信念而做出自我牺牲、为了尊严宁可放弃优厚待遇的做法。人工智能的最大难点是如何从“机器性”过渡到“人性”。因此,我们不惧怕赢棋的“阿尔法围棋”,但可能会惧怕经过深思熟虑后主动输棋以讨绝大多数人喜欢的“阿尔法围棋”。因为后者可能已经进化出人的感情和价值观,成为真正能与人类匹敌的对手了。
对于这一点,很多影视作品都进行过探讨。当施瓦辛格扮演的T-800机器人在电影《终结者5》中说出充满感情色彩的台词“我老了,但是还没有过时”,你还会认为他是台只知道打打杀杀的机器吗?
据“阿尔法围棋”研发者介绍,这款围棋程序包含两个“大脑”:一个是对每一步棋进行概率分析的“策略网络”,即“策略大脑”;另一个是进行全局判断的“价值网络”,即“价值大脑”。
其实,按照现有的科技发展规律,拥有“策略大脑”的计算机赢棋并不是很难。因为任何棋类游戏的落子位置是有限的,只要计算机的计算能力足够强大,用穷举法把每一步棋的位置变化都算出来,做到每下一步棋的赢棋概率接近甚至达到100%,这个拥有“策略大脑”的“阿尔法围棋”就可以成为当之无愧的世界第一棋王。和常人对决不同的是,人机对决的关键是前期的几手棋,人类棋手一旦前期出现失误,后期再怎么精于算计也赢不了机器。而且每名棋手前期的习惯走棋方式也是可以根据历史数据获取的,这些都大大降低了计算的难度。
“阿尔法围棋”的设计师透露,在挑战李世石之前,他们的内部测试概率就是5∶0完胜。这真的不见得是吹牛。1965年,英特尔公司创始人摩尔提出了“摩尔定律”,也就是当价格不变时,集成电路上的元器件数目每隔18?24个月便会增加一倍,性能也会提升一倍。如今,多核中央处理器的出现和云计算技术使计算机的整体运算速度仍然保持突飞猛进的发展。2015年10月,“阿尔法围棋”就以5∶0完胜欧洲围棋冠军、职业二段选手樊麾。
而这次人机大战最有意思的亮点其实是“阿尔法围棋”的“价值大脑”。1997年5月,当时IBM的超级电脑“深蓝”在经过六盘对决后,战胜了国际象棋世界冠军卡斯帕罗夫。“深蓝”当时只有一个“策略大脑”。而如今“阿尔法围棋”所拥有的“价值大脑”则会根据对局的需要做出“价值判断”。如果一步棋即便会对局部造成损失,但是对全局有价值,计算机也会加以判断后果断出招。例如“阿尔法围棋”对阵李世石第二局中的第37手黑棋,这步棋当时被看作是不顾自己左下角损失的“烂”棋,但却成为后来连聂卫平都要“脱帽致敬”的关键一步,体现出“阿尔法围棋”所具有的“价值判断”的威力。
不过,赢几盘棋显然并不是“阿尔法围棋”的终极目标。谷歌推出围棋程序的目的还是为了测试人工智能的程度。3月13日,李世石终于扳回一盘,表示“这一胜太有价值,我不会用任何东西来换”。在李世石看来,这盘赢棋的价值在于终于挽回了自己和人类的面子。而拥有“价值大脑”的“阿尔法围棋”凭借这盘输棋名正言顺地获得国际围棋排名的正式积分,成为世界排名第四的正式棋手,因为如果没有输棋记录将不会被记分。不管什么棋,本质上还是游戏。对于人类来说,真正的游戏不仅仅在于输赢,更在于给每一名参与者和旁观者带来快乐。从这点来看,能否熟练进行价值判断才是实现人工智能的关键。
早在古希腊,亚里士多德就提出“人是理性的动物”,也正是在得与失的价值判断中,人才产生了自我意识,并以此为出发点开始进行改造外部世界的科学实践。与之相应的则是感性,它是根据人的情感好恶对理性价值观的修订。理性与感性的共同作用构成了人类独有的智慧和价值体系。从这点来看,“阿尔法围棋”要想模拟人类的智慧,其实是非常困难的。机器人可以精确计算出自己的利益得失,甚至能掌握人类所具有的知识,却无法理解人类为崇高的信念而做出自我牺牲、为了尊严宁可放弃优厚待遇的做法。人工智能的最大难点是如何从“机器性”过渡到“人性”。因此,我们不惧怕赢棋的“阿尔法围棋”,但可能会惧怕经过深思熟虑后主动输棋以讨绝大多数人喜欢的“阿尔法围棋”。因为后者可能已经进化出人的感情和价值观,成为真正能与人类匹敌的对手了。
对于这一点,很多影视作品都进行过探讨。当施瓦辛格扮演的T-800机器人在电影《终结者5》中说出充满感情色彩的台词“我老了,但是还没有过时”,你还会认为他是台只知道打打杀杀的机器吗?