论文部分内容阅读
许多人已经发现,人工智能是李开复的老本行!他建立的“非特定人连续语音识别系统”曾被《商业周刊》授予 “科学创新奖”,他开发的“奥赛罗”人机对弈系统击败了得过世界团体比赛冠军的选手。
李开復提出了 “五秒钟准则”,以此预测,从事翻译、新闻报道、保安、销售、交易、会计、司机等工作的人,10年内有约90%被
AI全部或部分取代。很多工作将变成服务业,比如医生。
人类的理智逻辑判断不堪一击,人的心灵才真的有意思,也许造物者今天把AI带到我们身边,就是逼我们去发展这些方面,文艺、创作、哲学……为什么每个人都要工作呢?有些人就画画拍照做雕塑,这世界不是挺好的么?
AI只是人类的工具,人类将步入一个崭新的人机协作时代,这可以被称作第二次文艺复兴。
一位科学家的预言
1982年,在申请卡内基梅隆大学计算机系时,李开复写了一封非常深情的申请信。信中,令他至今难忘的一点是,他表达了自己做研究的初心:“研究人工智能的意义是去探究人是怎么思考的,以及人为什么存在。”通过学习计算机来认清人类本身,说到底是个哲学问题,饱含人文情怀。
苹果、谷歌、微软公司的前高管,创新工场的创始人,这是李开复最为人知的身份,而今我们才发现,原来人工智能才是他的老本行!学生时代他已进入人工智能领域,至今都有36个年头了。“我是在1980年首先做的自然语言处理,1982年做的计算机视觉,1983做的语音识别,1985年做的人机对弈,1996年做的VR/ AR……” 李开复获得卡内基梅隆大学计算机学博士学位的博士论文题目是“非特定人连续语音识别系统”,1988年被《商业周刊》授予了“科学创新奖”,而他开发的“奥赛罗”人机对弈系统也在同一年击败了得过世界团体比赛冠军的选手……
然而,在人工智能世界里“绕了一圈”后,他却发现事与愿违:认为机器具有和人类一样的思维方式是十分荒谬的——真正能产生价值的AI,并不是模仿人的思考。
“人在数学问题上挺笨的。比如贷款,
人是if ,then;else(假如,就;或者)的思维。先看你有没有房子,有,我可以贷给你,没有,看你薪水,够高我贷给你,如果不够高,但工作满三年了也贷给你。就像一块蛋糕,用刀把它一切,如果你属于这一角,就贷款给你。但人工智能非常奥妙,它的思考方式完全不同,它不是在一个二三维的空间做切割,它是在一个两千维的空间里画一个非常美妙的函数,这个函数切开来,这边的人贷款给他,那边的都不要贷,它根本不是我们的思维方式,深到人无法理解。所以我并没有真地了解人是怎么思考的,或者说我很失望地发现人的思考非常肤浅,至少在数学方面,判断、分类或预测,我们彻底被机器击败了。”
所以今天李开复做了这样的预言:“十年之内,人类50%的工作会被AI取代。”机器使大部分人沦为无用者的图景在《未来简史》里已被描绘出来,但其作者尤瓦尔毕竟是位历史学家,而李开复则是位科学家,又身为科技界资深投资人,他的预言背后是对技术和行业的深度把握。对于哪些职业首当其冲,他还提出了一个“五秒钟准则”:一项本来由人从事的工作,如果人可以在5秒钟内对工作中需要思考和决策的问题作出相应的决定,那么,这项工作就有非常大的可能被人工智能技术全部或部分取代。比如翻译、保安、销售、客服、会计、司机等工作,未来10年有约90%人工智能全部或部分取代。”
生不逢时
李开复常叹息自己真是生不逢时。即使在人工智能研究中取得过举足轻重的成就,但很可惜,埋头实验室那些年他没有赶上AI技术的真正开花结果。“那时候我的这些选择基本上都是非常‘糟糕错误’的职业选择,因为每一件事情,我都是在它的黄金时代之前、白银时代之前,甚至破铜烂铁都不是的时代就涉足了。”
AlphaGo横空出世让AI一夜爆红,可其成就并非一蹴而就。在过去60多年中,它经历过三次浪潮。第一次是1950年代由“图灵测试”掀起的。计算机科学的开创者艾伦·图灵提出,让测试者和计算机通过键盘和屏幕对话,如果测试者分不清屏幕后的对话者是人还是机器,就可以说这台计算机具备人工智能。第二次浪潮是80年代到90年代,李开复可以说是站在了浪尖儿上。当时最具代表性的突破性进展之一是语音识别技术。李开复摒弃了传统的走语言学路子的专家系统,而建立起基于语音数据的语料库和概率统计模型,将语音识别从符号主义时代推动到了统计时代。
颇令他遗憾的是,他做研究时没有赶上深度学习技术革命,语音识别技术虽有明显提升,却始终无法满足人们需求。“做计算机研究这个领域,本身的素质能力当然都非常重要,但还要在正确的时候选择正确的事。我在错误的时候太过狂热地跳进了人工智能领域。”李开复感慨。
当下,深度学习和大数据携手掀起了天翻地覆的变化。首先在计算机视觉领域,它们帮助计算机认识人脸、图片和视频中的物体,然后又冲入语音识别、机器翻译、数据挖掘、自动驾驶等领域大展身手。在2014年ImageNet竞赛上,机器视觉第一次超越了人类肉眼识别准确率。2016年9月,微软最新的语音识别系统已成功地将识别错误率降低到了6.3%,在统计模型崛起后,错误率从40%降到了20%花了二十年,而深度学习时代,两三年时间就从20%降到了6.3%。因此李开复断言,人工智能的黄金时代已来临。
近一年中,李开复在清华大学、全球移动互联网大会、奇葩大会、哥伦比亚大学工程学院毕业典礼等各个公开场合中言必谈人工智能,十分活跃。既然无法以科学家的身份投入到这场革命中,用其他方式一樣可为其推波助澜——他要做一个伯乐,挖掘人工智能人才和创业公司。他的创新工场已投资30多家以人工智能为核心动力的公司,并创立了人工智能工程院。此外,他还想做一位“推广者”,让更多人意识到人工智能时代的降临,及早做好准备。他的新书就叫《人工智能》,用通俗的方式为大众普及其前世今生、方方面面。
为什么每个人都要工作呢?
尽管预言了机器将在明确又迅速的10年内取代人类的工作,不过与尤瓦尔的绝望截然不同,李开复对AI技术是乐观的,对AI参与下的人类未来饱含激情与期待。
回到故事的开头。在AI研究中“绕了一圈儿”后,李开复除了发现“人类理智和逻辑判断不堪一击”外,还有更重要的发现:“人的心灵才是真的有意思的。”
“当你与一个人一见钟情,当你第一眼看到你生的baby,你心中那种心灵触电的感觉(是机器不能捕捉的);安慰剂效应让我们吃面粉也可以把病医好(这是我生病后感受到的),心灵怎么会有这么强的治疗能力?这是机器不可解的。学AI学了半天,最后还是学到了人的奥妙,这个奥妙是情感,是爱,还是宗教?我们也不知道。也许造物者今天把AI带到我们身边,就是逼我们去发展这些方面,文艺、哲学、创作……也许这才是我们比较独特的地方,当然有一天可能也会被AI击破,但至少现在还没有看到那一天。”最终,他还是达到了36年前他写的那封信里的目的——“让我们更了解自己。”
所以,在李开复看来,机器拥有人的意识、人被机器所操控的想法是十分可笑的。AI只是人类的工具,最有可能变成现实的是人类步入一个崭新的人机协作时代。
工作被取代就等于失业吗?未必。李开复认为,人工智能时代里人类工作的转型在所难免,但这更多意味着新的工作方式。一部分简单、底层工作消失,也会催生更多新型的、更需要人类判断力和创造力的工作,如设计师、架构师、建筑师、流程设计和管理者、艺术家、文学家……当然,从短期看,转型会给社会带来一定程度的阵痛,但长远看,社会结构、经济秩序会重新调整,从而进一步解放生产力。
再说,“为什么每个人都要工作呢?”李开复相信,AI带给人类的将是更大的自由和更加个性化的人生体验。
“人的灵性和爱是不能被机器简单复制的,如果我们深信它们的存在,就应该鼓励更多的人去走这条路。无论是做个好的导游,还是做个老人院的志愿者,还是多花时间陪父母,这种爱心的发散并不直接产生经济价值,但对社会有正向影响。过去几千年,无论希腊还是中国的古人,他们都是在爱和美方面不断去创造。是不是过去这几百年我们根本走偏了?社会告诉人们要去做重复性工作,挣钱买车买房。2000年前的日子为什么一定是不好的?过去这300年的日子为什么一定是好的?人下岗了再给他找个重复性工作?也许他就应该过别的日子。这都是不同的思考方向,不要迷信过去的100年人的追求。
以前的诸侯不是还养食客吗?他们每天帮人出主意,进行思想的碰撞。我们就可以这样,来谈哲学、谈美,谈AI和人类学的改变,或理论上的碰撞,或创造一些美的事物,有些人就画画拍照做雕塑,这世界不是挺好的么?”
Q=《北京青年》周刊
A=李开复
Q:你预言十年之内人工智能会替代50%的人类工作,你还有个AI发展的十年蓝图,为什么对AI这么乐观?
A:算法是可以推演的。比如我们投资的智融集团的用钱宝,它八秒就能对一个陌生人判断借不借钱给它,一个人要花一个小时,这样就是500倍的提升。它是基于什么呢?大数据。那我们把它时空转移,用在车贷、房贷、企业贷款、债券的企业评级、保险,或用在我们内部做的AI量化投资,在某些领域可以看到很高回报,甚至能取代基金经理。
比如我们投资的Face++旷视科技,它有些应用的效率是人的20倍,人可以识别出来三个入侵者,Face++可以识别60个,它有300万人的数据库,人最多识别几千张人脸。那还有什么像识别人脸的?识别肿瘤、病理切片、MRI、CT……医学的领域特别大。这些都是一个已成的算法,把它延伸出去,看到它还能用到什么领域,是非常理性而且绝对正确的产业延伸。
深度学习有成功和没有那么成功的应用,有些领域还没那么成功,我就不会去做这种预测。所以我是基于:第一,对技术的深度理解,毕竟做了36年人工智能的研究了。第二,我们有一批特别顶尖的科学家在创新工场做顾问,以及看到已经投的案子用AI创造的价值,再加上它合理的领域的延伸,我对大数据领域无比乐观。
Q:你提到AI会带来一些阵痛,怎样解决短期的结构性失业和人才培养?
A:知己知彼,AI不善长什么我们就多做什么。机器不善于做领域扎得特别深的工作,还是要有人作为这个领域的专家,比如编程,这种人肩负责任特别重,不但要技术很强,还要有社会责任感。当然这可能是万里挑一。还需要什么人?跨领域人才。还有善用AI的人,就像今天你不会用Word、Excel你就落后了,20年前你会用,可能你作为记者的生产力就比别人高,所以要提早会用AI。最重要的一点是,机器不能取代我们的审美观,以及对美、爱和各种感情的需求,同理心、心灵碰撞和安慰剂效应。
考虑到我们孩子,就要让他们做全方位的发展了。做事要做得深,做自己爱做的事,要跨领域,要更努力。而且对服务业不要排斥,因为以后很多工作会变成服务业,它是人对人的,机器代替不了,要鼓励更多人进入服务业。我们创新工场是善于帮人做独角兽,但谁能教人做服务业,做个好的服务者,做个好的服务者的创业者,这些特别重要。还有社会要给做服务业的人一个崇高的地位,跟医生、护士、匠人、艺术家一样的层次。此外,还有无偿的服务业,我们要鼓励人去做,因为人们内心的交流是最重要的,去老人院孤儿院做志愿者,这些都要从孩子教育时就开始实行。不能跟孩子说,你坐在按摩室里很丢人,这是很low的工作,不能跟他说做导游不好,这些都可能是最适合人类的事。那些少数能够做到最顶尖,最跨领域的天才、专才,我们要把他们挖掘出来,但大部分人都做服务业。其实还有文化娱乐、艺术、考古学、人类学……AI的来临给我们带来很多新的研究机会。当你孩子说他对人类学有兴趣,想知道未来AI跟人类怎么结合,这是特别好的课题,鼓励他们去做,不要说人类学找不到工作,做父母的要彻底改变自己观点。
Q:在医疗领域,能否理解为医生会是一个最后做决策的人,他会参考AI给出的结论?
A:基于人对现在机器的担忧,和对“医生必然是人”(的坚持),初步的状态一定是这样。可能就是AI作为工具,医生做决策,因为这样就不需要新法律。但从科学家角度来看,这肯定不是最优的。在很多领域,医生还有可能说机器不对,但其实可能不对的是医生。我觉得有AI这个工具总是好事,它一定是第一个阶段,不然人不会接受。就像你可能不会接受一个律师、法官、警察是机器人,说你有罪,有罪在哪里?讲不出来。这个过渡有个周期,但最长远来说,一定是机器的诊量会超越医生,而且是一个一个领域地超越,不是第一天全面超越。有些领域是非常明确会超越的,比如肿瘤的识别,其他领域机器可能会更慢一些。
但最终医生会是什么样呢?我觉得医生会变成服务业。也就是机器看到病人,就会说你是四期滤泡性淋巴癌,你的五年存活率是23%,病人肯定不愿意听到这句话。所以医生做什么呢?要了解医学,了解病人,要用合适的语言与病人沟通。比如病人说,我盗汗了,机器知道你得了淋巴癌会说你当然盗汗。但医生会说,真的啊?多久了?严重吗?你现在温度多少?……病人得到一种关怀,然后医生会说,看来你很可能是得了滤泡性淋巴癌第四期,虽然是百分之百,但我们用的说法是“很可能”。这个病人会问,我能不能活下来?医生不会说23%,他说,你知道吗?李开复得了这个病,后来就好了,所以你只要自信,睡眠足够,增加抵抗力,按照我的方法医疗,真的是蛮有可能好,这个病人一下就感觉还有救,他就不会再放弃治疗,这种安慰剂效应就会开始发生,然后他真的存活了。机器可能做不了这一层,所以以后医生并不会被取消,只是他们要能够接受,他们变成了一个服务业的工作者。
Q:在《未来简史》中,尤瓦尔说人类会最终落入自己织造的罗网,因人无力处理大量数据,只能将权力交给人工智能,比如我们的选举投票、购买商品和选择配偶方面,你怎么看?
A:肯定不会的。比如选择配偶,一个女孩子平均要约会十个男孩最后选择配偶,这十个男孩可能一部分是介绍的,一部分来自婚恋网站,一部分是偶遇的,但未来这十个人可能大部分都是电脑帮她介绍的,会帮她做最好的搭配。但这十个里最后挑选嫁给谁,还是要靠恋爱跟感情,这个是机器无法取代的,所以他错误地把这个筛选跟决策都交给了电脑,这是一个对人类的人性的一种背叛。
选举时,有可能我们会把候选人过去的事挖出来,或预测看到一些人成功率只有10%,把他们排除,但如果你相信民主制度,最后还是由人投出这一票。购买商品也是一样,网购时会被推荐很多商品,最后买不买还是在你。世界上男人太多,你不可能每个都去约会一次,世界上的商品太多,也不能每个去买一个,那我们用人工智能帮你筛筛,最后还是你来选。
有些事是要用心来选择的,有些事可能就无所谓了。比如交通,以最快的速度从place A到place B,对99%的人来说就是UBER或滴滴随叫随到。当然可能会有1%的人还是要买古董车自己开开。我觉得这时就要分辨,当新消费习惯来临后,过去的习惯可能被颠覆。可能大部分人不那么爱车了是可以的,但让机器选老公这事我觉得很荒谬,当这一天发生时,我觉得也不需要老公,嫁给机器人算了。
Q:你工作和生活中与AI的关联度高吗?比如家里是否有人工智能设备? A:我如果用手机,基本都用语音输入。我家里有 Amazon Echo和小鱼在家,我所有的理财都是机器人打理的。
Q:你对AI改变你的生活有什么样的感受?
A:我用的每个APP背后其实都是AI,你用的也是。百度、淘宝、美团、滴滴,它们给你的推荐、各种排序都是靠AI做的,还有创新工场的门禁是Face++,我们是不戴名牌的,所以其实AI已经渗透到我的身边,也会渗透到所有的人的身边。
Q:你说自己生不逢时,80年代就开始研究人工智能,当时你的心态是怎样的?觉得AI在什么时候能够达到这样的力量?
A:当时我做出了第一套不指定语者的语音识别系统,被《商业周刊》认为是当年最重要的创新之一,也被《纽约时报》、《华尔街日报》报道过。但现在回想,当时还是挺天真的,因为我当时觉得离应用不远,可能五年之内就可以应用,现在看,当时犯了几个大错误。第一个是,一个实验室的结果到一个真实应用的场景差得还很远;第二个,对于这个场景的真实用户的强需求和价值,作为一个科学家我是不懂的,我只是觉得语音进去字出来就够好,在应用中只要你把平台做好,用户就会来。当时我们内部鼓励员工的一句话就是:build it and they will come,有部电影就是这个词,就是我相信我只要把棒球场搭出来,球员跟观众就会来,最后他的梦想真的成真了,但在我们的领域这只是梦想,除非解决了用户的强需求。还有我觉得科学家总是在优化自己做了什么过去没做过的事,为了创新而创新,没有足够地意识到这种强需求和用户才是上帝。
还有科学家对应用场景的想象力其实非常欠缺,你看中国做计算机视觉的人全去做人脸识别,为什么?因为他博士论文就是做这个,于是一直做下去。但人脸识别只是应用之一,但科学家把它做成一个优化创新,把一件事做得非常紧密,做得很深,不会考虑到做事的速度、迭代和用户强需求。所以一个科学家创业,这两者是一定要在一个人身体里都有,再不然就要兩个人合作,一个纯科学家创业,挑战蛮多的。
Q:在当下的AI浪潮中你是一个什么样的角色?
A:我工作上当然是去当伯乐,找好的项目,投资,拿好的回报,然后确保选的是不作恶的人,因为人工智能公司是潜在很可怕的公司。另外我同样希望扮演的一个角色是,让整个社会知道人工智能时代即将来临,它对世界有颠覆性作用,会带来好事,也会带来挑战,让大家提早认知到,并选择自己的方向。
Q:创新工场现在投了30多家以AI为核心驱动力的公司,你选择投资的标准是怎样的?哪几个是你们比较看好将来会有很大突破的?
A:选择的企业里一定要有人工智能科学家,因为现在AI还没有成为一个平台,AI还是个高门槛的事,能做的人不是很多。同时我们希望它是用一个已知的算法去解决一个新领域的问题,这样的搭配会最快地创造商业价值,即在已有大数据的领域把人工智能用上来。第二种就是一些新的感知,它能够传新的数据,然后创造前所未有的应用,这可能更像Face++。第三种,自动化是未来,比如机器人、无人驾驶、回了家就有帮你按摩洗脚做菜的机器人。这三种我们都在投。
我投第一种时,我们要了解的就是它为谁服务,需求强不强,产生的价值大不大,数据哪里来,这些问题必须要解决。第二个领域就要看新的sensor(感知)怎么布局。比如美图,它靠女孩子的自拍;而Face++靠监测摄像头数据的上传和认证。第三个领域,无人驾驶实在太难了,能不能不要做完全的无人驾驶,要限制场景。是垃圾车、扫地车、景区车还是在停车场的车,在这些场景里做有限制的应用。所以我们要求其实是完全不一样的,在非常成熟的领域真的不要发明什么东西,赶快把钱赚出来,再稍微长远一点的是,去哪里搞数据,在更长远的是,要限制场景。我们会用我们的专业的方法来评估这三个领域,确保它是符合的。
那给你三个例子。第一个例子是我们投资的智融集团用钱宝,它现在每个月放贷150万单,已经超过世界上最大的银行,而且是在短短的18个月之内。它是在做风控,8秒钟做一个抉择,远超人类。它产生的价值也是巨大的,人来做这个工作就不现实了。为了借出一千块钱,我花一个小时那怎么挣钱呢?用机器花8秒钟不但很精确,坏账率很低,而且它是可扩张的,当我的放贷量从1万涨到10万再涨到100万,它只要加服务器就可以了,所以它非常符合这种原则,它很快就要上市了。
Face++是我们怎样把人脸识别这个应用做到最佳,怎样把效率提高。刚才说了它在很多场景里比人类识别效率高20倍,它还有在识别人脸之外的突破,比如识别车牌、物体、商品、卫星图和肿瘤,前景非常大。
最后一个领域无人驾驶我们投资的驭势科技,吴甘沙非常务实地限制他的场景,就在刚才讲的这几个领域里面能开车,不是开到狂风暴雨的北京,或在充满雾霾的一天里开,或到胡同里去开。他是最早做出可用的无人驾驶车之一的公司,我们非常看好。
李开復提出了 “五秒钟准则”,以此预测,从事翻译、新闻报道、保安、销售、交易、会计、司机等工作的人,10年内有约90%被
AI全部或部分取代。很多工作将变成服务业,比如医生。
人类的理智逻辑判断不堪一击,人的心灵才真的有意思,也许造物者今天把AI带到我们身边,就是逼我们去发展这些方面,文艺、创作、哲学……为什么每个人都要工作呢?有些人就画画拍照做雕塑,这世界不是挺好的么?
AI只是人类的工具,人类将步入一个崭新的人机协作时代,这可以被称作第二次文艺复兴。
一位科学家的预言
1982年,在申请卡内基梅隆大学计算机系时,李开复写了一封非常深情的申请信。信中,令他至今难忘的一点是,他表达了自己做研究的初心:“研究人工智能的意义是去探究人是怎么思考的,以及人为什么存在。”通过学习计算机来认清人类本身,说到底是个哲学问题,饱含人文情怀。
苹果、谷歌、微软公司的前高管,创新工场的创始人,这是李开复最为人知的身份,而今我们才发现,原来人工智能才是他的老本行!学生时代他已进入人工智能领域,至今都有36个年头了。“我是在1980年首先做的自然语言处理,1982年做的计算机视觉,1983做的语音识别,1985年做的人机对弈,1996年做的VR/ AR……” 李开复获得卡内基梅隆大学计算机学博士学位的博士论文题目是“非特定人连续语音识别系统”,1988年被《商业周刊》授予了“科学创新奖”,而他开发的“奥赛罗”人机对弈系统也在同一年击败了得过世界团体比赛冠军的选手……
然而,在人工智能世界里“绕了一圈”后,他却发现事与愿违:认为机器具有和人类一样的思维方式是十分荒谬的——真正能产生价值的AI,并不是模仿人的思考。
“人在数学问题上挺笨的。比如贷款,
人是if ,then;else(假如,就;或者)的思维。先看你有没有房子,有,我可以贷给你,没有,看你薪水,够高我贷给你,如果不够高,但工作满三年了也贷给你。就像一块蛋糕,用刀把它一切,如果你属于这一角,就贷款给你。但人工智能非常奥妙,它的思考方式完全不同,它不是在一个二三维的空间做切割,它是在一个两千维的空间里画一个非常美妙的函数,这个函数切开来,这边的人贷款给他,那边的都不要贷,它根本不是我们的思维方式,深到人无法理解。所以我并没有真地了解人是怎么思考的,或者说我很失望地发现人的思考非常肤浅,至少在数学方面,判断、分类或预测,我们彻底被机器击败了。”
所以今天李开复做了这样的预言:“十年之内,人类50%的工作会被AI取代。”机器使大部分人沦为无用者的图景在《未来简史》里已被描绘出来,但其作者尤瓦尔毕竟是位历史学家,而李开复则是位科学家,又身为科技界资深投资人,他的预言背后是对技术和行业的深度把握。对于哪些职业首当其冲,他还提出了一个“五秒钟准则”:一项本来由人从事的工作,如果人可以在5秒钟内对工作中需要思考和决策的问题作出相应的决定,那么,这项工作就有非常大的可能被人工智能技术全部或部分取代。比如翻译、保安、销售、客服、会计、司机等工作,未来10年有约90%人工智能全部或部分取代。”
生不逢时
李开复常叹息自己真是生不逢时。即使在人工智能研究中取得过举足轻重的成就,但很可惜,埋头实验室那些年他没有赶上AI技术的真正开花结果。“那时候我的这些选择基本上都是非常‘糟糕错误’的职业选择,因为每一件事情,我都是在它的黄金时代之前、白银时代之前,甚至破铜烂铁都不是的时代就涉足了。”
AlphaGo横空出世让AI一夜爆红,可其成就并非一蹴而就。在过去60多年中,它经历过三次浪潮。第一次是1950年代由“图灵测试”掀起的。计算机科学的开创者艾伦·图灵提出,让测试者和计算机通过键盘和屏幕对话,如果测试者分不清屏幕后的对话者是人还是机器,就可以说这台计算机具备人工智能。第二次浪潮是80年代到90年代,李开复可以说是站在了浪尖儿上。当时最具代表性的突破性进展之一是语音识别技术。李开复摒弃了传统的走语言学路子的专家系统,而建立起基于语音数据的语料库和概率统计模型,将语音识别从符号主义时代推动到了统计时代。
颇令他遗憾的是,他做研究时没有赶上深度学习技术革命,语音识别技术虽有明显提升,却始终无法满足人们需求。“做计算机研究这个领域,本身的素质能力当然都非常重要,但还要在正确的时候选择正确的事。我在错误的时候太过狂热地跳进了人工智能领域。”李开复感慨。
当下,深度学习和大数据携手掀起了天翻地覆的变化。首先在计算机视觉领域,它们帮助计算机认识人脸、图片和视频中的物体,然后又冲入语音识别、机器翻译、数据挖掘、自动驾驶等领域大展身手。在2014年ImageNet竞赛上,机器视觉第一次超越了人类肉眼识别准确率。2016年9月,微软最新的语音识别系统已成功地将识别错误率降低到了6.3%,在统计模型崛起后,错误率从40%降到了20%花了二十年,而深度学习时代,两三年时间就从20%降到了6.3%。因此李开复断言,人工智能的黄金时代已来临。
近一年中,李开复在清华大学、全球移动互联网大会、奇葩大会、哥伦比亚大学工程学院毕业典礼等各个公开场合中言必谈人工智能,十分活跃。既然无法以科学家的身份投入到这场革命中,用其他方式一樣可为其推波助澜——他要做一个伯乐,挖掘人工智能人才和创业公司。他的创新工场已投资30多家以人工智能为核心动力的公司,并创立了人工智能工程院。此外,他还想做一位“推广者”,让更多人意识到人工智能时代的降临,及早做好准备。他的新书就叫《人工智能》,用通俗的方式为大众普及其前世今生、方方面面。
为什么每个人都要工作呢?
尽管预言了机器将在明确又迅速的10年内取代人类的工作,不过与尤瓦尔的绝望截然不同,李开复对AI技术是乐观的,对AI参与下的人类未来饱含激情与期待。
回到故事的开头。在AI研究中“绕了一圈儿”后,李开复除了发现“人类理智和逻辑判断不堪一击”外,还有更重要的发现:“人的心灵才是真的有意思的。”
“当你与一个人一见钟情,当你第一眼看到你生的baby,你心中那种心灵触电的感觉(是机器不能捕捉的);安慰剂效应让我们吃面粉也可以把病医好(这是我生病后感受到的),心灵怎么会有这么强的治疗能力?这是机器不可解的。学AI学了半天,最后还是学到了人的奥妙,这个奥妙是情感,是爱,还是宗教?我们也不知道。也许造物者今天把AI带到我们身边,就是逼我们去发展这些方面,文艺、哲学、创作……也许这才是我们比较独特的地方,当然有一天可能也会被AI击破,但至少现在还没有看到那一天。”最终,他还是达到了36年前他写的那封信里的目的——“让我们更了解自己。”
所以,在李开复看来,机器拥有人的意识、人被机器所操控的想法是十分可笑的。AI只是人类的工具,最有可能变成现实的是人类步入一个崭新的人机协作时代。
工作被取代就等于失业吗?未必。李开复认为,人工智能时代里人类工作的转型在所难免,但这更多意味着新的工作方式。一部分简单、底层工作消失,也会催生更多新型的、更需要人类判断力和创造力的工作,如设计师、架构师、建筑师、流程设计和管理者、艺术家、文学家……当然,从短期看,转型会给社会带来一定程度的阵痛,但长远看,社会结构、经济秩序会重新调整,从而进一步解放生产力。
再说,“为什么每个人都要工作呢?”李开复相信,AI带给人类的将是更大的自由和更加个性化的人生体验。
“人的灵性和爱是不能被机器简单复制的,如果我们深信它们的存在,就应该鼓励更多的人去走这条路。无论是做个好的导游,还是做个老人院的志愿者,还是多花时间陪父母,这种爱心的发散并不直接产生经济价值,但对社会有正向影响。过去几千年,无论希腊还是中国的古人,他们都是在爱和美方面不断去创造。是不是过去这几百年我们根本走偏了?社会告诉人们要去做重复性工作,挣钱买车买房。2000年前的日子为什么一定是不好的?过去这300年的日子为什么一定是好的?人下岗了再给他找个重复性工作?也许他就应该过别的日子。这都是不同的思考方向,不要迷信过去的100年人的追求。
以前的诸侯不是还养食客吗?他们每天帮人出主意,进行思想的碰撞。我们就可以这样,来谈哲学、谈美,谈AI和人类学的改变,或理论上的碰撞,或创造一些美的事物,有些人就画画拍照做雕塑,这世界不是挺好的么?”
Q=《北京青年》周刊
A=李开复
Q:你预言十年之内人工智能会替代50%的人类工作,你还有个AI发展的十年蓝图,为什么对AI这么乐观?
A:算法是可以推演的。比如我们投资的智融集团的用钱宝,它八秒就能对一个陌生人判断借不借钱给它,一个人要花一个小时,这样就是500倍的提升。它是基于什么呢?大数据。那我们把它时空转移,用在车贷、房贷、企业贷款、债券的企业评级、保险,或用在我们内部做的AI量化投资,在某些领域可以看到很高回报,甚至能取代基金经理。
比如我们投资的Face++旷视科技,它有些应用的效率是人的20倍,人可以识别出来三个入侵者,Face++可以识别60个,它有300万人的数据库,人最多识别几千张人脸。那还有什么像识别人脸的?识别肿瘤、病理切片、MRI、CT……医学的领域特别大。这些都是一个已成的算法,把它延伸出去,看到它还能用到什么领域,是非常理性而且绝对正确的产业延伸。
深度学习有成功和没有那么成功的应用,有些领域还没那么成功,我就不会去做这种预测。所以我是基于:第一,对技术的深度理解,毕竟做了36年人工智能的研究了。第二,我们有一批特别顶尖的科学家在创新工场做顾问,以及看到已经投的案子用AI创造的价值,再加上它合理的领域的延伸,我对大数据领域无比乐观。
Q:你提到AI会带来一些阵痛,怎样解决短期的结构性失业和人才培养?
A:知己知彼,AI不善长什么我们就多做什么。机器不善于做领域扎得特别深的工作,还是要有人作为这个领域的专家,比如编程,这种人肩负责任特别重,不但要技术很强,还要有社会责任感。当然这可能是万里挑一。还需要什么人?跨领域人才。还有善用AI的人,就像今天你不会用Word、Excel你就落后了,20年前你会用,可能你作为记者的生产力就比别人高,所以要提早会用AI。最重要的一点是,机器不能取代我们的审美观,以及对美、爱和各种感情的需求,同理心、心灵碰撞和安慰剂效应。
考虑到我们孩子,就要让他们做全方位的发展了。做事要做得深,做自己爱做的事,要跨领域,要更努力。而且对服务业不要排斥,因为以后很多工作会变成服务业,它是人对人的,机器代替不了,要鼓励更多人进入服务业。我们创新工场是善于帮人做独角兽,但谁能教人做服务业,做个好的服务者,做个好的服务者的创业者,这些特别重要。还有社会要给做服务业的人一个崇高的地位,跟医生、护士、匠人、艺术家一样的层次。此外,还有无偿的服务业,我们要鼓励人去做,因为人们内心的交流是最重要的,去老人院孤儿院做志愿者,这些都要从孩子教育时就开始实行。不能跟孩子说,你坐在按摩室里很丢人,这是很low的工作,不能跟他说做导游不好,这些都可能是最适合人类的事。那些少数能够做到最顶尖,最跨领域的天才、专才,我们要把他们挖掘出来,但大部分人都做服务业。其实还有文化娱乐、艺术、考古学、人类学……AI的来临给我们带来很多新的研究机会。当你孩子说他对人类学有兴趣,想知道未来AI跟人类怎么结合,这是特别好的课题,鼓励他们去做,不要说人类学找不到工作,做父母的要彻底改变自己观点。
Q:在医疗领域,能否理解为医生会是一个最后做决策的人,他会参考AI给出的结论?
A:基于人对现在机器的担忧,和对“医生必然是人”(的坚持),初步的状态一定是这样。可能就是AI作为工具,医生做决策,因为这样就不需要新法律。但从科学家角度来看,这肯定不是最优的。在很多领域,医生还有可能说机器不对,但其实可能不对的是医生。我觉得有AI这个工具总是好事,它一定是第一个阶段,不然人不会接受。就像你可能不会接受一个律师、法官、警察是机器人,说你有罪,有罪在哪里?讲不出来。这个过渡有个周期,但最长远来说,一定是机器的诊量会超越医生,而且是一个一个领域地超越,不是第一天全面超越。有些领域是非常明确会超越的,比如肿瘤的识别,其他领域机器可能会更慢一些。
但最终医生会是什么样呢?我觉得医生会变成服务业。也就是机器看到病人,就会说你是四期滤泡性淋巴癌,你的五年存活率是23%,病人肯定不愿意听到这句话。所以医生做什么呢?要了解医学,了解病人,要用合适的语言与病人沟通。比如病人说,我盗汗了,机器知道你得了淋巴癌会说你当然盗汗。但医生会说,真的啊?多久了?严重吗?你现在温度多少?……病人得到一种关怀,然后医生会说,看来你很可能是得了滤泡性淋巴癌第四期,虽然是百分之百,但我们用的说法是“很可能”。这个病人会问,我能不能活下来?医生不会说23%,他说,你知道吗?李开复得了这个病,后来就好了,所以你只要自信,睡眠足够,增加抵抗力,按照我的方法医疗,真的是蛮有可能好,这个病人一下就感觉还有救,他就不会再放弃治疗,这种安慰剂效应就会开始发生,然后他真的存活了。机器可能做不了这一层,所以以后医生并不会被取消,只是他们要能够接受,他们变成了一个服务业的工作者。
Q:在《未来简史》中,尤瓦尔说人类会最终落入自己织造的罗网,因人无力处理大量数据,只能将权力交给人工智能,比如我们的选举投票、购买商品和选择配偶方面,你怎么看?
A:肯定不会的。比如选择配偶,一个女孩子平均要约会十个男孩最后选择配偶,这十个男孩可能一部分是介绍的,一部分来自婚恋网站,一部分是偶遇的,但未来这十个人可能大部分都是电脑帮她介绍的,会帮她做最好的搭配。但这十个里最后挑选嫁给谁,还是要靠恋爱跟感情,这个是机器无法取代的,所以他错误地把这个筛选跟决策都交给了电脑,这是一个对人类的人性的一种背叛。
选举时,有可能我们会把候选人过去的事挖出来,或预测看到一些人成功率只有10%,把他们排除,但如果你相信民主制度,最后还是由人投出这一票。购买商品也是一样,网购时会被推荐很多商品,最后买不买还是在你。世界上男人太多,你不可能每个都去约会一次,世界上的商品太多,也不能每个去买一个,那我们用人工智能帮你筛筛,最后还是你来选。
有些事是要用心来选择的,有些事可能就无所谓了。比如交通,以最快的速度从place A到place B,对99%的人来说就是UBER或滴滴随叫随到。当然可能会有1%的人还是要买古董车自己开开。我觉得这时就要分辨,当新消费习惯来临后,过去的习惯可能被颠覆。可能大部分人不那么爱车了是可以的,但让机器选老公这事我觉得很荒谬,当这一天发生时,我觉得也不需要老公,嫁给机器人算了。
Q:你工作和生活中与AI的关联度高吗?比如家里是否有人工智能设备? A:我如果用手机,基本都用语音输入。我家里有 Amazon Echo和小鱼在家,我所有的理财都是机器人打理的。
Q:你对AI改变你的生活有什么样的感受?
A:我用的每个APP背后其实都是AI,你用的也是。百度、淘宝、美团、滴滴,它们给你的推荐、各种排序都是靠AI做的,还有创新工场的门禁是Face++,我们是不戴名牌的,所以其实AI已经渗透到我的身边,也会渗透到所有的人的身边。
Q:你说自己生不逢时,80年代就开始研究人工智能,当时你的心态是怎样的?觉得AI在什么时候能够达到这样的力量?
A:当时我做出了第一套不指定语者的语音识别系统,被《商业周刊》认为是当年最重要的创新之一,也被《纽约时报》、《华尔街日报》报道过。但现在回想,当时还是挺天真的,因为我当时觉得离应用不远,可能五年之内就可以应用,现在看,当时犯了几个大错误。第一个是,一个实验室的结果到一个真实应用的场景差得还很远;第二个,对于这个场景的真实用户的强需求和价值,作为一个科学家我是不懂的,我只是觉得语音进去字出来就够好,在应用中只要你把平台做好,用户就会来。当时我们内部鼓励员工的一句话就是:build it and they will come,有部电影就是这个词,就是我相信我只要把棒球场搭出来,球员跟观众就会来,最后他的梦想真的成真了,但在我们的领域这只是梦想,除非解决了用户的强需求。还有我觉得科学家总是在优化自己做了什么过去没做过的事,为了创新而创新,没有足够地意识到这种强需求和用户才是上帝。
还有科学家对应用场景的想象力其实非常欠缺,你看中国做计算机视觉的人全去做人脸识别,为什么?因为他博士论文就是做这个,于是一直做下去。但人脸识别只是应用之一,但科学家把它做成一个优化创新,把一件事做得非常紧密,做得很深,不会考虑到做事的速度、迭代和用户强需求。所以一个科学家创业,这两者是一定要在一个人身体里都有,再不然就要兩个人合作,一个纯科学家创业,挑战蛮多的。
Q:在当下的AI浪潮中你是一个什么样的角色?
A:我工作上当然是去当伯乐,找好的项目,投资,拿好的回报,然后确保选的是不作恶的人,因为人工智能公司是潜在很可怕的公司。另外我同样希望扮演的一个角色是,让整个社会知道人工智能时代即将来临,它对世界有颠覆性作用,会带来好事,也会带来挑战,让大家提早认知到,并选择自己的方向。
Q:创新工场现在投了30多家以AI为核心驱动力的公司,你选择投资的标准是怎样的?哪几个是你们比较看好将来会有很大突破的?
A:选择的企业里一定要有人工智能科学家,因为现在AI还没有成为一个平台,AI还是个高门槛的事,能做的人不是很多。同时我们希望它是用一个已知的算法去解决一个新领域的问题,这样的搭配会最快地创造商业价值,即在已有大数据的领域把人工智能用上来。第二种就是一些新的感知,它能够传新的数据,然后创造前所未有的应用,这可能更像Face++。第三种,自动化是未来,比如机器人、无人驾驶、回了家就有帮你按摩洗脚做菜的机器人。这三种我们都在投。
我投第一种时,我们要了解的就是它为谁服务,需求强不强,产生的价值大不大,数据哪里来,这些问题必须要解决。第二个领域就要看新的sensor(感知)怎么布局。比如美图,它靠女孩子的自拍;而Face++靠监测摄像头数据的上传和认证。第三个领域,无人驾驶实在太难了,能不能不要做完全的无人驾驶,要限制场景。是垃圾车、扫地车、景区车还是在停车场的车,在这些场景里做有限制的应用。所以我们要求其实是完全不一样的,在非常成熟的领域真的不要发明什么东西,赶快把钱赚出来,再稍微长远一点的是,去哪里搞数据,在更长远的是,要限制场景。我们会用我们的专业的方法来评估这三个领域,确保它是符合的。
那给你三个例子。第一个例子是我们投资的智融集团用钱宝,它现在每个月放贷150万单,已经超过世界上最大的银行,而且是在短短的18个月之内。它是在做风控,8秒钟做一个抉择,远超人类。它产生的价值也是巨大的,人来做这个工作就不现实了。为了借出一千块钱,我花一个小时那怎么挣钱呢?用机器花8秒钟不但很精确,坏账率很低,而且它是可扩张的,当我的放贷量从1万涨到10万再涨到100万,它只要加服务器就可以了,所以它非常符合这种原则,它很快就要上市了。
Face++是我们怎样把人脸识别这个应用做到最佳,怎样把效率提高。刚才说了它在很多场景里比人类识别效率高20倍,它还有在识别人脸之外的突破,比如识别车牌、物体、商品、卫星图和肿瘤,前景非常大。
最后一个领域无人驾驶我们投资的驭势科技,吴甘沙非常务实地限制他的场景,就在刚才讲的这几个领域里面能开车,不是开到狂风暴雨的北京,或在充满雾霾的一天里开,或到胡同里去开。他是最早做出可用的无人驾驶车之一的公司,我们非常看好。