【摘 要】
:
胡泳 北京大学新闻与传播学院教授 大数据的中心原则涉及搜寻运营数据之间的相关性,这个想法简单明了。借助廉价的云存储,我们现在可以收集与各种业务流程相关的令人眼花缭乱的数据,从到达公司装卸码头的卡车数量,到在给定的日期和時间内每分钟处理的订单量,再到假日周末后的星期一收到的客户投诉数量。新的功能强大的处理器和可扩展的数据库使熟练的操作员可以挖掘这些数据,以寻找数据内的模式:特别是操作变量之间的相关
论文部分内容阅读
大数据的中心原则涉及搜寻运营数据之间的相关性,这个想法简单明了。借助廉价的云存储,我们现在可以收集与各种业务流程相关的令人眼花缭乱的数据,从到达公司装卸码头的卡车数量,到在给定的日期和時间内每分钟处理的订单量,再到假日周末后的星期一收到的客户投诉数量。新的功能强大的处理器和可扩展的数据库使熟练的操作员可以挖掘这些数据,以寻找数据内的模式:特别是操作变量之间的相关性。通过发现这些模式,大数据有望暴露出复杂的关系,以解决瓶颈问题,改善日常运营。在理想状态下,我们可以认为,数据驱动生产力的全新时代由此开始。
问题在于这些相关性常常是虚假的。这使得数据专业人士往往需要挥舞魔杖来确定哪些大数据关系是有意义的,而哪些仅仅是巧合。要想解决这个问题,其实可以用一种更简单的方法来显示相关性:纳入带有语境的“小数据”(small data)。情境意识,也就是上下文,可以使看似复杂的情况变得清晰明了。情境的最简单示例可能是位置。Google Now就是使用你当前的位置来提供高度相关的搜索建议,例如在步行范围内的商家。其他形式的情境信息还包括人(例如与你一起工作的人)和时间(例如重合的日历预约)。对企业推荐引擎最有用途的情境类型之一是主题,比如邮件的信头信息。了解到一个员工目前最关注的事情,推荐引擎可以建议与这些主题中相关的电子邮件、文档和商业交易。很明显,将电子邮件用作情境的锚定物,可以消除无关内容的提示,因为数据工具意识到这些无关内容与你当前念兹在兹的东西完全不相干。
进行情境计算(contextual computing)所需的四种关键数据为:社交、兴趣、行为和个人。这四方面中有些已经相当成熟,而有些在这几年才开始流行。能自如地掌握并运用这四项数据的玩家,将在互联网行业的竞争中占据极大的优势。社交数据显示了你如何与其他人联系以及他们如何相互联系。它还揭示了这些联系的性质和情感相关性。在理想的情境计算状态下,软件和服务的轻轻一推就可以将两个陌生人联系到一起,他们同时在同一地点,并且可以相处融洽。然而,如果你对某个人的活动和兴趣知之甚少,那么世界上的所有社交数据都将毫无用处。而一个人的口味和喜好很大程度上是围绕着彼此相关的主题组织起来的。它也与同你自己的生活非常相似的个人之间的口味重叠相关。但兴趣图谱无法读取你的好奇心可能将你引入的新方向。而且,它也做不到根据你所阅读的内容有效地推荐你喜欢的餐厅或度假胜地。行为是最可以轻松掌握的数据。行为数据很容易描述你实际所做的事情,而不是你声称要做的事情。传感器可以完成这项工作,自我报告机制也是如此。这些数据可以与兴趣数据两相对照,从而使计算机能够(也许比你更好)算出你下一步做什么的可能性。个人则是与一个人的最深层信仰、核心价值观和个性有关的一组数据。它是令一个人在世界上与众不同的原因,就像社交数据有助于显示一个人与他人相似的原因一样。鉴于心理学仍然难以准确解释我们的个人认同如何发挥作用,因此以可计算的形式记录此类信息的过程甚为缓慢就不足为奇了。
单独掌握某一大项的数据,并不能得出可靠的结论,以及作出完美的情景计算。也因此,对待大数据要有正确的态度。既不要忽视数据的价值,也不要把数据当成神。
其他文献
最近有两条金融领域的消息颇引人注目,一条是彭博发文称香港IPO保荐机构已是内地公司的天下,一条是两笔美元新债—马尔代夫主权债和大韩航空永续债全部由中资投行独家承销。这两条消息的一个共同指向就是,中资投行正在原来几乎由国外投行垄断的领域开始分得一杯羹。 所谓投行是一个泛指,即从事证券发行、承销、交易、企业重组、兼并与收购、投资分析、风险投资、项目融资等投行相关业务的金融机构。美国一般叫投行,在中国
9月底,一份恒大“求助信”广为流传。恒大方面否认了这封信的真实性,但恒大资金不宽裕,负债率较高,这早已是公开的秘密。 恒大的“反击”措施包括两方面:一是香港的很多分析师集体对恒大给予了正面评价,这些投行分析师来源很广,基本上在香港的主流投行都发了声。二是民企朋友圈用实际行动来力挺恒大,比如内地民企苏宁购入恒大的股票,而香港大亨刘銮雄、郑裕彤家族旗下的企业也开始购入恒大票据。 “许首富”的朋友圈
8月29日,山西省臨汾市,襄汾县陶寺乡陈庄村聚仙饭店坍塌事故现场一片狼藉 9月1日,山西临汾市聚仙饭店坍塌后第四天,陶寺乡陈庄村已经恢复平静。事发现场竖起了高高的深灰色铁皮,把聚仙饭店的红字招牌遮挡了起来。 但仍有一些迹象诉说着这里的“不平静”。 1小时内,有4辆装载着祭祀物品的三轮车,从饭店前的002乡道上开过去,它们都在东南方向的第一个路口右拐,径直穿过安李村的牌楼。安李村有多位村民,在
摘要: 在美国IMMEX理念和技术指导下,基于IMMEX-C (Interactive Multimedia Exercises-China)国内研发平台,结合学校研发“有机燃料”化学问题集的教学与测试,就学生解决问题思维过程开展评价设计与评价分析的实证研究。通过“思维回路图”评价量表中“步长”和“回路”变化情况的评价设计,将学生的解决问题思维过程划分为: 思维混沌状态、思维谨慎状态、思维跳跃状态
一个星期天的上午,我随朋友参加ICS创新空间举办的一个广州导赏课,这个由非盈利组织举办的项目,旨在于社区中推进对广州本土文化,尤其是历史的了解。朋友参加课程,成了其中一位见习导赏员。 我随她所在的小组,穿越了一些小时候曾经走过的旧街旧巷。 穿过龙津东路逼仄的驿巷,这里每一个小铺仿佛还是20年前的模样,阿姨在编藤椅,阿伯在卖肠粉,粤语旧曲悠扬动听,转角处一把暗绿的吊扇,像极了老电影里的布景。路上
荣智慧主笔 我的邮箱去年作为招聘邮箱公开过一次,今年已经不再负责,但偶尔也还有善于“考古”的同学,发来求职的邮件。前几天有一封求职信颇为“特别”—在简历后附上了几首诗。 如今写诗的人很少,中文系的学生也没有几个会写诗、爱写诗。不过,写诗的人少,并不能代表还在写诗的人,写出来的就一定是好诗。坐在书房里,忽然很需要自我表达,写几句话而自娱自乐,也是一件有趣的消遣;但既无深切的生命体验,又无广厚的情
谭保罗常务副主编城市研究院院长 这两天看到一个新闻。韩国前总统李明博因贪污受贿,被法院判处有期徒刑17年。等他刑满释放,出生于1941年的他已经96岁。 在2018年,另一位前总统朴槿惠也被判入狱。当时她66岁,如果按照30年刑期,出生于1952年的她出狱时也是96岁的老奶奶了。 我发现一个有意思的现象,韩国总统在下台后基本上都很惨。在21世纪,韩国有四位总统执政(不算2017年执政至今的文
徐英瑾 复旦大学哲学学院教授 席卷全球的新冠疫情,时下依然还没有立即结束的迹象。不过,抽空考察中国历史上的瘟疫暴发的历史,研判其起因与消长规律,可能对当下的我们还是有意义的。因为篇幅所限,这里我们仅仅将目光聚焦于汉末的瘟疫。汉末倒数三个皇帝桓帝、灵帝、献帝在位期间(略去在位时间过短的刘辨),瘟疫不断席卷中土,并在献帝期间达到高峰。很多著名的词句,如曹操《蒿里行》中的“白骨露於野,千里无鸡鸣”,以
李少威 我们这样的职业,一般情况下没有时间看电影。 然而我也感觉到,不管怎样我们也离不开电影。因为我们需要故事,人的一生,能够亲自经历的故事不多,要想这一生活得丰富,活得明白,活出几辈子的感觉来,就需要故事。 思想建构这件事情,就是让一个人身上叠加多重时代、多重人生的过程。这种有意义的体验,属于知识分子,而今天,因为多种媒介的存在,它開始属于多数人。我发自内心地认为这是一件很棒的事情,也是一
评《南风窗》2020年第9期封面报道《新冠,新世界》 “没有与过去一刀两断,但很多事情确实回不去了”,用这句话概括新冠肺炎疫情带来的影响,可谓贴切。 从个人认知的角度来看,这种影响可以归纳为三个层面,个人的、国家和社会的、世界的。 个人层面,是从经历中悟出的一种新的家庭观。这个春节,我和弟弟留守在了工作的上海和深圳。但假期过得并不轻松,反而提心吊胆。因为妹妹是从武汉回家的,家乡离武汉又近,过