特斯拉和Waymo,做自动驾驶有何不同?

来源 :计算机应用文摘 | 被引量 : 0次 | 上传用户:myxyj2007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读

“貌合”“神离”的两套方案


  2月底,Way m o首席科学家D rag o Anguelov在MIT(麻省理工学院)首次开讲,他分享的内容主题为“解决自动驾驶中的长尾问题”(Taming The Long Tail of Autonomous Driving Challenges),这应该是外界对Waymo自动驾驶研发目前能够了解到的最深度、最详细的内容了。
  近些年,使用大量标注过的数据对深度学习网络进行监督训练,使得物体感知和行为预测能力有了大幅提升,这些技术在Waymo自动驾驶开发过程中得到了大规模应用。我们也从 Drago Anguelov口中第一次知道了Waymo在使用“模仿学习(imitation learning)”,这里先“科普”一下。
  模仿学习属于机器学习的一种,它的神经网络能够通过“观察”人类的行为将某些特定的动作和场景进行匹配。如果使用不同类型的“人类行为”作为数据源来训练,最终神经网络就能够根据感知的结果输出相对应的决策动作。例如,“如果你看到停车标志,马上停车”以及“如果前方有辆停着的车挡路了,绕开它”等。
  随着商业化试运营的推进,谷歌(Waymo为谷歌旗下的子公司)能够采集数据的场景更多了,模仿学习算法也就有了更频繁的用处。但Drago Anguelov也指出,人类驾驶行为存在着很多不确定性,一些罕见的场景(所谓的“长尾”问题),Waymo的数据集中并没有足够的案例来训练算法应对。出现这种情况就只能依靠开发人员手动编写算法。Drago Anguelov认为这种“折中”的做法迟早是会被机器学习代替的。
  根据Waymo官方披露的数据显示,Waymo目前已经累积了约1 500万英里的行驶里程。按照平均每3 000万英里才会出现一起事故的概率来计算的话,Waymo可能到现在都没有得到一个特定的“长尾”案例。假设行驶每100万英里会发生一起事故,Waymo也不过积累了15个数据而已。按照普通机器学习神经网络需要的数据量(每个图像分类需要至少1 000个样本)的标准来看,Waymo似乎还差得有些远。
  尽管Drago Anguelov表示希望通过采集尽可能多的人类驾驶行为(包括“长尾”案例)来进行模仿学习,但“数据量的缺失”是个很大的问题。
  而为了弥补这方面的缺陷,Waymo已经构建出了一套仿真模型,仿真出尽可能多的场景来进行测试。因为有时会得出截然相反的结果,所以要加强系统的鲁棒性,做出足够多的仿真模型,确保系统的准确性。
  不过仿真模型的建立依然需要真实世界数据的支持,解决“长尾”问题也需要对人类驾驶行为进行大量的模仿学习。所以这就又回到了问题的原点,Waymo还需要更大量级“数据”的支持。
  对比之下,似乎“差生”特斯拉在“数据”问题上还真是不发愁。
  特斯拉目前预计有超过40万辆搭载了Autopilot系统的车辆在道路上行驶,单日行驶里程超过了1 300万英里。如果未来这个车队的规模增加至超过100万辆,那么每月产生的有效行驶里程将到达10亿英里的量级。对一家已经有成熟产品落地的车企而言,这种真实世界产生的“数据”根本不是问题。
  至于特斯拉在自动驾驶研发上的独特性,根据外媒The Information曾经透露的信息,特斯拉同样在利用“里程累积”上的优势进行模仿学习。据熟悉特斯拉这套系统的知情人士爆料称,特斯拉的车辆在行驶过程中会将摄像头及其他传感器的数据搜集起来,Autopilot是否运行并没有关系。之后工程师可以将这些数据中人类的驾驶行为与不同的场景进行匹配,此后遇到类似的场景机器就可以模仿人类去执行—比如怎样拐弯或躲避障碍物等。
  当然这种被叫做“行为克隆”的方法也有局限性,但特斯拉的工程师认为只要有足够的数据支撑,神经网络就能够给出正确的决策结果,例如在绝大多数场景中如何转向、刹车以及加速。在特斯拉看来,未来不再需要人类手动编程控制无人车应对特定场景。
  事实上,特斯拉的软件工程师提到的“行为克隆”和Waymo的“模仿学习”是一个意思,等同于大家都在讲的“端到端学习”的方案,即使用一个巨大的神经网络,输入传感器数据后得到关于转向、加速和刹车的整体执行策略。
  假设特斯拉采用的是“端到端学习”方案,那它肯定是不需要对图像进行标记的。唯一需要“标记”的是人类驾驶员的行为,比如转向角是多少、加减速的力度等。将整个传感器数据输入到一个巨大的神经网络后,系统会学习如何将传感器数据与人类驾驶员的行为进行匹配。但我们知道特斯拉是在做图片标记的,所以从这一点出发考虑,它采用的就不大可能是和Waymo一样的“端到端学习”的策略。

“端到端”与“语义抽象”


  针对自动驾驶感知的算法差异,Mobileye創始人Amnon Shashua曾经对“端到端学习 (End-to-End Learning)”和“语义抽象(Semantic Abstraction)”这两个概念做过详细的讲解。
  而根据外媒The Information报道的内容来推断,特斯拉可能是在开发一套用于路径规划或执行控制的神经网络。而用来训练这套神经网络的数据并非来自传感器,而是由感知神经网络输出的元数据。这样人类驾驶员的直接行为—转向、加速和刹车可以对元数据进行“标记”,类似端到端学习中,驾驶行为与传感器数据的匹配。
  这种将感知层和执行层神经网络分开的做法能够规避Amnon Shashua教授提到的端到端学习可能产生的一系列问题:如“不常见场景”出现的几率会大幅下降;对先备知识(Prior Knowledge)的要求提高,深度神经网络在解决一些简单问题上可能会“惨败”。   假设特斯拉用于训练的数据来自特斯拉车主,通过人工的方式将一些“坏的”行为去掉,这样可以避开人工编码算法的局限和模拟测试的不真实。当然特斯拉还可以使用强化学习或监督学习来进一步优化。可以把路径规划或执行控制的神经网络放在运行Autopilot或其他驾驶辅助功能的车辆上,一旦出现系统脱离、失效或碰撞等情况,工程师就可以通过BUG报告来定位原因。这些“错误”之后还可以用来训练新的神经网络。
  如果上面猜测正确的话,这种方法可以用相当快的速度来解决路径规划和执行控制方面的问题。考虑到目前搭载硬件2.0版本的特斯拉车型每个月可以获得近10亿英里的行驶里程,获得的数据量之大是Waymo无法企及的。之后硬件3.0版本上线后,搭载了AI芯片的这套系统会更有利于特斯拉算法的迭代。

一场马拉松式的长跑


  尽管Waymo深受“数据”的困扰,但光凭对这个维度的考量自然是没办法断言什么的。只不过Waymo要解决自动驾驶中的“长尾”问题,自然需要更多的数据支持。Waymo近日宣布将在亚利桑那州的梅萨市开设新的技术服务中心,进一步扩大无人车出行服务的规模。显然Waymo是奔着搜集更多“数据”的目的来的。
  也有人认为,Waymo可以效仿特斯拉开发一套类似Autopilot的驾驶辅助系统,仅使用成本低廉可量产的传感器。一旦在市场铺开后,搜集真實场景的驾驶数据也就不是什么难事了。当然,Waymo自己要完成这件事比较困难,肯定需要来自主机厂领域的合作伙伴。
  不久前有消息称,“Waymo正在寻求外部投资人”,这其实是意料之中的计划。如果有车企成为Waymo的股东,要获得海量的驾驶数据自然容易得多。而且Waymo作为自动驾驶解决方案的供应商,始终只有借助OEM的平台才能最终获得商业化成功。不管是手中的全栈自动驾驶技术,还是正在进行的移动出行业务,Waymo对很多车企而言,都是有十足吸引力的合作伙伴。Cruise和通用、福特与Argo.AI,这些都是比较成功的先例。
  对特斯拉而言,之前因为Model 3陷入“量产地狱”,Autopilot的研发进程似乎出现了停滞,硬件3.0也迟迟没有发布。尽管在“数据”容量上有先天优势,但率先量产以及频发的几次事故使其屡陷舆论风波。所以,特斯拉在自动驾驶上到底能有怎样的成就,还在还很难说。
  不过笔者个人倒是蛮欣赏之前马斯克说过的一段话。他说,“我不认为哪家企业能在特斯拉之前打造出一套综合性的自动驾驶解决方案。除非它们保密工作做得太好了,到时候要拿出惊人的成果来。我觉得这种可能性不大,对特斯拉而言,任何车企都不是我们的竞争对手”。
  希望这种“目中无人”的狂妄自大,可以给特斯拉带来点好运气。
  写在最后
  预计到2030年自动驾驶市场规模将达到8 000亿美元,自动驾驶行业的竞争也会越来越激烈。如果将自动驾驶比作一颗树,算法算力就是它的种子,决定了它成长潜质;数据就是它的土壤养分,决定了它成长速度。特斯拉和Waymo在数据量以及算法算力的竞争就是未来整个自动驾驶行业的缩影。
其他文献
近日,腾讯游戏宣布与ROG(玩家国度)达成战略合作,将与ROG在中国大陆地区进行游戏手机深度合作,专注于游戏内容在硬件上的性能优化,为用户提供更优质的游戏体验。那么,双方的碰撞到底能不能擦起火花呢?带着更加强悍的合作伙伴,“胡汉三”又回来了  在智能手机尚未普及的时候,腾讯便有了入局的心态,比如在最早起有传言腾讯自研手机并采用MeeGo系统,不过腾讯发布的第一套手机系统还是腾讯tita,只是“存在
逃離直播困境,短视频是蓝海?  “就算要赔一笔违约金也要解约,过去这几年的青春都白费了!”近日,深圳某直播公会的8位网红主播同时宣布解除合约、退出公会,她们决定离开直播圈转战短视频领域,主播杨佳媚便是其中的一位。  “从泛娱乐到垂直领域,再到强化内容质量,我们几乎都试过了。”谈起这次退会,杨佳媚略显沮丧,她感觉相比刚入行时,自己和身边的几位好友两年来改变了很多,无论是直播的风格还是内容,都换了太多
核心业务下滑,亏损继续扩大  在美团公布2019年第一季度财报公告后,美团股价即刻进入下跌通道,全天收报每股58.15港元,总市值缩水近200亿港元。股市的看空氛围,来自于财报中的几个关鍵数据:首先,美团在2019年第一季度,经调整净亏损额达14.33亿元人民币,比上个季度又增加了近亿元人民币,依然在延续着自上市以来的巨亏状态。  更令资本市场担忧的是,美团的外卖核心业务,出现了总收入、交易金额、
这短短一年,周钊形容为“过山车一般的体验”。2016年7月,优拜单车正式入局共享单车战场。这时候的街头,还只有橙色的摩拜单车和黄色的ofo单车。  周钊告诉笔者,当时团隊高层讨论时判断,共享单车是最后一公里的出行解决方案,能够达到和地铁、公交车一样的消费频次,“每天可能有上亿元的订单,共享单车未来可能是一个比‘滴滴’更大的出行市场。”  投资人和入局者都期待着这个市场迅速壮大。  优拜单车成立半年
公开资料显示,如涵控股成立于2001年,业务主要涵盖三大板块,分别为红人经纪、营销推广及电商业务,近年间其孵化的网红代表有张大奕、大金和虫虫等。目前,如涵控股有113个签约的网红(KOL),有1.484亿粉丝,91个自营网店(复购用户39%)。  此外据天眼查信息显示,如涵控股成立至今进行了多轮融资,投资方包括阿里巴巴、君联资本、赛富投资基金、昆仑万维和金石投资等。  早在2016年,如涵控股就迎
不切实际的趣店和大白汽车  众所周知,2017年10月趣店风光上市,1个月后便推出大白汽车,高调进军汽车新零售领域,这是趣店上市之后的第一个大动作,罗敏将其定位为趣店另一个“引擎”。当时,罗敏和大白汽车负责人许龍对于大白汽车的未来寄予厚望,均放出豪言。  “到今年年底,大白汽车就将跃居全国汽车零售的TOP 5;再过几年,大白汽车的年销量将达到200万辆,成为全球最大的汽车零售商。”罗敏在趣店201
为什么没有发布iPhone 12系列?  作为一年一度的“科技圈春晚”,2020年苹果秋季新品发布会上的新品并不少,并且其中一些产品调整策略也耐人寻味,笔者总结如下:Apple Watch Series 6可以测量血氧水平,将健康管理功能拉升到了一个新的台阶;借鉴iPhone的策略,推出了廉价版的Apple Watch SE,为Apple Watch的销售带来变量;A14仿生芯片首次在iPad A
理论上可行,实际操作很难  9月底,上海信息安全行业协会副主任张威在2019年国家网络安全宣传周全民体验日活动上向公众提示了剪刀手照片泄露指纹信息的风险—他表示,1.5米内拍摄的剪刀手照片,基本上能100%还原出被摄者的指纹;在1.5米~3米的距离内拍摄的照片,能还原出50%的指纹。  对此,图正科技董事长、创始人刘君认为,剪刀手照片泄露指纹信息在理论上可行,但操作起来很难。实际操作很难的一个原因
外界很多人可能并没意识到,过去三年,站稳全球手机出货量第一阵营的vivo,内心其实蛮焦虑的。  三年前,全球智能手机产业走向了巅峰,而vivo是其中最大得利者之一。借着智能机与4G的浪潮,这家公司在2016年收尾之际,站在了年入千亿元俱乐部门槛上。  不过,在那个值得庆贺的千元亿时刻,vivo CEO沈炜最突出感受却是:“如履薄冰。”  在电子产业浮沉创业了20多年,沈炜闻得到巅峰背后的危险气息。
剥离家电业务积极转型,“中年危机”的TCL想跟上潮流  从两个人的措辞中,可以感受到两家企业对于此次合作不同的侧重点。李东生侧重的是“中国制造业的转型升级”,而雷军侧重的是“小米做强大家电业务”。其实任何两家企业“牵手”和“联姻”的目的都不“单纯”,必定是因为这种合作的背后存在着能够惠及自身的因素,尤其是对小米和TCL这种表面上看起来关联性不强的企业更是如此。  为什么说看似没有关联?在TCL剥离