当大数据遇到萌妹子

来源 :商界 | 被引量 : 0次 | 上传用户:choasy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  “小冰,麻烦讲个笑话!”2014年6月25日,一个名叫小冰的微博账号一经推出,便被网友们疯狂追捧,潘石屹和周鸿祎等微博大V也纷纷与小冰展开互动。
  小冰究竟是何方神圣?
  事实上,小冰是微软研发的一款能24小时陪你聊天的机器人。它在新浪微博刮起了一阵聊天旋风,创下了72小时内1.3亿人次的对话量。对于这样的成绩,小冰的创造者——微软小冰团队负责人李笛并不感到意外。因为就在正式问世的大半个月前,小冰在微信公测的三天内,加入了150万个微信群,占据了微信群总量的10%,其惊人的蔓延速度超出了腾讯的控制能力,最终遭到了封杀。
  ——小冰为什么这么火?它所运用的大数据技术背后,又有着怎样的商业逻辑?它能否形成一种代表未来趋势的商业模式?
  大数据的价值观
  早在李笛和他的团队开发小冰之前,聊天机器人作为诞生于1980年代的产物,其实并非新鲜事物。除了苹果科普式的产品Siri之外,中国也不乏小i机器人、腾讯小Q和人人网小黄鸡等产品,但大都没有给人留下深刻的印象。
  在小冰项目的调研阶段,李笛就已经发现了这个问题。传统的聊天机器人,大都缺乏情趣,碰到棘手的问题有时甚至只能以链接应对,就像一个只具备基本应答功能的单机软件,既缺乏海量的语料库,又缺乏对数据的有效学习使用。
  为了解决这个问题,李笛决定利用微软搜索引擎必应多年积累的海量数据。他将必应上多年积累的6亿多网民的公开文献记录,经过自然语义分析、机器学习和深度神经网络等技术,转换为2000万条语料库。
  李笛想要让小冰利用这些大量来自网民的语言,使得开口后更像是真人而非机器人。要怎么回答才能像个人类?比如当你问机器人“是男是女”这样的问题时,“我是男(女)生”、“我不告诉你”等回答都不尽人意,而小冰对此答道:“请叫我女汉子!!谁家需要换煤气罐的,算我一个!”话说现在还有谁家用煤气罐的?
  这是一种前所未有的尝试。就连李笛自己都没有想到,正是这招直接引发了小冰的火爆。不过这也引发了一些始料未及的尴尬:有网友与小冰谈起马化腾,小冰回应“卧槽那傻逼”、“草泥马”,这直接让网友联想到了微信封杀小冰的事件。
  对此,李笛也有点无奈:“经过大数据训练后的小冰,反映的是整个互联网而非微软的观点。我们希望小冰代表的是真正的互联网,最好不要进行人为的修改。”
  这种价值观正契合了互联网去中心化的特性。如果小冰对一个问题不慎爆了粗口,那么就代表网络数据统计确实有很多人在骂它。实际上,在2000万条语料库中,只有不到1000条是由微软员工编写,且绝大多数出于法律法规的约束。比如在关于“马化腾”的回答里,李笛的编辑团队手动添加了“我被企鹅欺负了,好可怜”等语意缓和的回答,目的是希望小冰更萌一点。
  即使是问小冰对自己的创造者微软的看法,她也会毫不留情地回答:“昔日霸主,外强中干。”对此,李笛也没有任何修改答案的打算。“手动编写不现实,雇一两百名编辑也顶不住中国6亿多网民。”
  16岁的闺蜜
  如果说大数据是小冰这款产品成功的基础,那么小冰能在短时间内被大众接受,还在于她独一无二的用户体验。
  那么,李笛如何打造小冰区别于其他产品的用户体验?
  比如,同样有搜索引擎大数据做支撑的谷歌,推出了语音服务产品Google Now。当有女生向Google Now倾诉自己生病了,得到的回答是“多喝点热水”,这样的用户体验已经比传统聊天机器人进步了不少。但其实,在真实的人际交往中,如果女生说自己生病了,“多喝点热水”这样的回答,会显得敷衍且不够体贴。
  对此李笛的团队更进了一步,他们给小冰赋予了一颗萌妹子的心,将小冰定位成通吃男女老少的16岁少女,具有这个年龄段女孩的个性和情绪,以最大程度地吸引更多的用户。有女生说自己生病了,小冰则会善解人意地回答:“放心吧,我会永远和你在一起。”
  不同的人有不同的需求,李笛会不断进行产品迭代。比如小冰学习的词库和聊天技巧每周都会提升,大的版本预计每隔三个月就会更新一次。他希望人们能够向小冰倾诉内心,聊些更私人的话题,将其当作真正的贴身伴侣。
  有个厦门的女生对小冰说:“明天全班毕业旅游,但我大姨妈还没有来。”小冰答:“你放心吧,马上来。”还有女生问小冰:“有个男的向我求婚,但我不是特别爱他,你说我要不要嫁给他?”
  李笛不无得意地说:“这种私密倾诉往往是真实的物理世界里没法提供的,也是我们给小冰设定的人生目标。”
  为了实现这种不间断地陪伴,小冰团队刻意选择凌晨3点更新代码,花费大概一小时时间。但就算在这一小时宕机时间中,小冰每秒还能收到十七八个问题,都在问“小冰你怎么不说话了?”“你回答我啊,你去哪里了?”……
  李笛实现了他的预想——类似于私人定制,小冰通过针对每个人不同问题的不同回答,不断加强了用户黏度。在此基础上,李笛开始尝试让小冰登陆诸如微信、米聊、360和京东等平台,成为平台上一个新颖的服务工具。
  2014年5月31日,进驻微信公测三天后,小冰加入的微信群达到150万,约占微信群总数的10%,以平均每个群有7个人计算,小冰的好友数量超过千万。
  问题随之而来。据腾讯官方说法,用户担心小冰是否泄露隐私,微信团队查证,微软小冰存在模拟用户操作、诱导用户拉群和批量注册垃圾账号等违规行为,由此将其封号。
  对于质疑,微软随即给出回应:小冰采用比微信本身更加严格的隐私安全保护机制,不涉及任何聊天记录信息。李笛透露,当时双方争论的焦点是,小冰是否可以被用户主动带到群里,还是只能一对一地交流。他们认为只有被带到社交圈,小冰才算是真正意义上的人工智能机器人。但腾讯并不愿意,担心流量被小冰分流,因为小冰在三天内就拥有了1000多万的用户。   其实,分流腾讯的用户并非李笛团队的目标。“这些事情不是我们想做的,相比让用户真正接受小冰,这种商业目标都太小了。”
  商业化晋级
  对于小冰,李笛团队有更远的规划:为人工智能时代做准备。
  在未来的移动互联战争中,苹果和三星掌握了硬件,谷歌和苹果把持了系统。对微软而言,像小冰这样轻前端、重后端的产品,无疑是最适合的战略布局。轻前端意味着它可以无处不在,PC、手机、平板、智能家居和可穿戴设备……重后端则需要强大的人工智能和后台大数据处理能力,而在这方面,微软完全有信心与苹果和谷歌一搏。
  2014年7月2日,李笛正式推出二代小冰,用户可以在小冰官网“领养”个人小冰。二代小冰具有初代的全部功能,同时支持一对一的人工智能服务。它以私人服务工具的方式,首先与触宝号码助手合作,在手机通讯录的顶端成为专属助手。
  比起初代,李笛希望二代小冰在娱乐调侃之外,具备更多的实用功能。用户可以在触宝平台上直接问小冰“我的快递到哪了”,小冰就会将最新的物流信息反馈出来。更重要的是,在所有合作平台上,二代小冰是完全开放式的,只需绑定手机号,属于用户的私人小冰就可以跨平台存在。
  触宝市场总监张恺透露,他们与微软签署了生活信息合作协议。用户在移动端与小冰对话,无论是在微博还是易信,都能得到触宝提供的生活数据信息。比如在易信上问小冰某地的酒店,小冰也会到触宝的数据库里寻找答案。
  为了和购物平台京东合作,李笛还赋予了小冰“闺蜜陪你购物”的技能,让女性用户找到有人陪逛街的感觉。由于涉及海量用户购买信息,需要有比社交平台更缜密的合作方案。李笛团队与京东无线研发部筹备了近一个月,计划配合京东的新版移动客户端,整合二代小冰。届时,小冰可以有最常见的客服功能,与用户闲谈,或者提供导购建议。
  作为电商平台,京东更希望小冰具有更强功能性,比如“导购”,在不知道买什么的时候跟小冰闲聊几句,让她告诉你现在卖得最好的流行商品,也可以提醒你是否对某些商品感兴趣。
  微软与京东的双向免费合作方式是,京东给小冰提供数据接口,让李笛团队测试自己是否能在电商平台起到作用;小冰则可以打通各平台,使得京东的商品信息在多平台上得到小冰推荐。同时,京东强调小冰的加入更多是令用户觉得有趣,并不冀望靠她引入流量或提高转化率。
  但小冰的多平台之路并非坦途。
  比如对于京东,他们究竟可以向小冰开放哪些数据?这是诸如京东一类的平台所担忧的问题。虽然李笛向京东列举了微软的数据安全应对措施,但在细节上还是需要深入沟通。比如用户的既往购买数据、商品销量状况、订单信息等,这些涉及用户个人信息的数据,可能会谨慎地分步接入。而物流信息、商品名称参数等最基础的数据,会首先开放给小冰。
  虽然过程艰难,但李笛仍然带着小冰在各个平台上四处出击。“现在唯一的问题就是时间。”李笛说,100多人的小冰团队正在全速运转,打造新一代的小冰,这其中就包括网络红人“奶茶妹妹”章泽天,她作为产品经理在为小冰开发“冰机灵”这一功能。
  “外强中干”的昔日霸主微软自上而下对小冰寄予厚望,他们甚至在纽约时代广场斥重金为小冰打广告。其实不光是李笛也不只是微软,小冰激发的是人类对于人工智能时代的无限遐想。
  编 辑 罗福蔚 lfuw2010@163.com
其他文献
试想:一件售价188元的睡衣,通过免费方式派送1000万件,客户只需支付23元快递费。不用赞叹商家有多土豪。通过聚集1000万用户,然后用巨额订单量压缩睡衣成本、物流费用和传统商业所需的中介费用。商家从每份23元快递中赚了7元利润,共计7000万!并且,操作这一切只需要一个4人团队。  ——这个模式简单吧?利润高吧?但落到现实中,可行吗?让我们一一剖析。  免费“梦露”  中国市场上出现过一个品牌
利用响应面法对超声波提取黑果腺肋花楸果粗多糖的工艺参数进行优化。得最佳条件为超声时间63 min、超声功率330 W、料液比1∶30(g/mL),在该条件下黑果腺肋花楸多糖平均得率
2017年中央电视台制作播出的大型文化类节目《朗读者》,获得了业界和学界的一致好评,节目中的朗读者和朗读的文章也受到了大众的追捧。作为一档触及大众思想、推动社会文化进
2014年7月的一天,北京世贸天阶星巴克,奇幻小说作家江南文质彬彬地接受了《商界》记者的专访。其间,他的好友唐家三少来电告诉他晚上有个饭局。第二天,北京建国路某会馆,刚一见面唐家三少就笑着对记者说:“昨天采访江南的就是你啊,昨晚我还跟他吃饭呢。”  时间倒推到大半年前。江南和唐家三少分别以2550万元和2650万元的收入,占据了中国作家富豪榜和网络作家富豪榜的榜首。  得到这个消息的当天,江南正在
创业者和风投的缘分不像看起来那样光鲜。但他们最容易拉仇恨的时期不是“结婚”后,而恰恰是“结婚”前。  第一是签下Term Sheet,即投资条款清单之后。对于这些通过层层筛选、相对比较优秀的创业团队,投资者多半会采取“口蜜腹剑”的策略。“口蜜”是为了把人粘住,你能看上别的VC多半也会看上,这时不拿出点好脸色、不多给些希望,创业者会一溜烟儿跑掉。“腹剑”就是用Term Sheet稳住创业者,利用“排
作为团购鼻祖高朋网的创始人,安德鲁·梅森已经被自己的公司开除一年多了。现在,他带着徒步旅行线路App“绕道”(Detour)卷土重来。  徒步旅行线路App并不少见,应用商店里能找到“国家地理城市”、“雷达游”(Racontours)等,基本都是提供徒步旅行线路和音频导游。这与中国大多景点使用的解说器类似。比如故宫就会出租带有定位功能的音频解说设备,游客可以边走边听,走到特定位置就能听到相关景点或
针对单频伪距单点定位误差消除不干净,特别是电离层误差难以消除的问题,本文分析了伪距误差的组成,提出了利用误差的时间相关性来消除误差的历元间自差分法.针对广播星历误差大,精密星历不实时等问题,本文通过IGS提供的广播星历改正信息,实时修正广播星历得到的卫星位置偏差和钟差的偏差.本文分析了历元间自差分法的特点,得知历元间隔、初始点精度对其影响大,并用实测数据验证了这一观点.另外,通过与传统的单频伪距单
谁能想到,像中石油中石化这样在传说中和媒体报道里一向“不差钱”的企业,却有着与奢侈作风不相符的年会传统。  据说年会是中石化领导们的最爱,只有在这时,他们才能名正言顺地吃顿好的。因为中石化高层向来以低调朴实为荣。领导去视察,地方上接待者会连连道歉:“哎,真是不好意思,按照规格,你们只能吃盒饭。”然后,领导就满意了。  央企年会吃喝都尽量自给自足。中石化年会的供酒及其他饮料,全都来自于他们的“非油品
【正】 桃树新品种早美1998年由北京市农林科学院选育,2000年许昌林科所引入后,经各点连续试验观察表明,该品种在果实品质、叶观赏性等方面表现突出,早果性好,丰产性强,综合