更多的数据,更大的麻烦

来源 :大科技·百科新说 | 被引量 : 0次 | 上传用户:lovewxb1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  大数据也有大麻烦
  我们身处于这样一个数据爆炸的时代,尤其是最近这些年来我们生产的数据量和分析量都在激增。据统计分析,过去的30年里,每两年,世界上的数据量就增加了约10倍——这一比率甚至使得摩尔定律都相形见绌。而现在世界上90%的数据是在过去两年里创造出来的。对于数据分析来说,这是伟大的,现在的我们得到了比人类历史上任何时候都要多得多的数据供我们分析和操纵。很了不起不是吗?但是这就代表着我们可以高枕无忧地随意使用这些数据了吗?
  在大数据时代,人们越来越倾向于“用数据说话”。由数据驱动的决策被认为是一种明智的做法,但数据的真实性又会很大程度上影响决策的正确与否。因为数据是有偏见的,或者说人类收集和分析数据时是有偏见的。数据并不是越多越好,鱼龙混杂的结果就是可能让我们更加难以接近真相。
  在许多分析算法中,筛选信息起着非常重要的作用。如果没有筛选,我们可能会经历“无用输入/无用输出”的情形。但是筛选的依据是什么?是以数量决定权重吗?毋庸置疑,肯定是越近期的事件可参考的数据越多,如果将此定为高权重的部分,那么我们很容易得到一个不太准确的结论,因为我们抛弃了那些因为年代久远而被认为是低权重的重要事实。
  最新的就一定更好?
  喜新厌旧似乎是我们每个人的天性,我们对他人或是事件的最新认知往往会在做判断时占据主要的地位。比如两个本来很要好的朋友,小A一直很照顾小B。小A最近因为其他事情上的不顺而好几次把气撒在小B身上。小B也很是生气,觉得小A根本就没把自己当朋友,两人关系破裂,形同陌路。为何只是小小的几次不和就会对一段亲密关系造成如此之大的杀伤力?原因在于我们对近期发生的事情的印象过于深刻,反而忽略了以往存在的事实。
  如果世界上90%的数据都是最近两年里创造出来的,那么我们的数据就存在固有的“近因偏差”。这种认知偏差让人们倾向于认为,我们在近期观察到的趋势和模式将在未来继续存在。因此人们会增加对近期所发生的事件的重视,并假设这些模式会与即将要发生的事情有直接的联系,并以此作为制定决策的关键。
  比如,你所居住的城市最近几年的夏天都温度较低,你就认为当地的气候在变冷,但很可能明年气温就回升了;你看到这支股票近期的势头很好,一直在上涨,你可能会预测它会一直这样无限期地持续下去,而这显然也是不太可能的;尤其是,在中国,房价已经连续上涨了几十年,几乎已经没人相信中国房价未来会跌了。
  虽然历史会重演,但近期的表现并不能直接表明未来的成功或失败。因此,重要的是,不要给一个信息不成比例的关注。当我们给我们的大数据系统塞进大量过多的近期数据时,数据分析将会被近因效应极大地扭曲,很有可能你因此得出的预测结论还不如你掷硬币来得可靠些。
  如果想做出明智的决策,不仅要学会降低对近期表现的关注度,还要对以往的表现考虑得多一些。仅仅通过是六个月或一年的表现去分析可能并不扎实,如果不懂得从更遥远的过去收集更多的信息数据,反过来,就会误导自己做出草率的决定,成为目光短浅之人。
  学会删除数据更为重要
  当然,最新的数据不一定是最好的,以往的老数据也同样不等于就是绝对有用的。关键是在时间的锤炼过程中,学会删除有缺陷和无效的数据。
  比如你是一个喜欢拍照的人,时间久了你的手机相册里会存有很多张照片。假设你手机的存储空间是固定的,那么你就必须定期清理那些照片。你需要想想哪些是值得你留下来作为以后会回顾的相片,而哪些是你将来看都不会再看一眼的。如果你为了省事,只留下新照片,直接把那些老照片都删除了,你可能会删除许多珍贵的值得留念的照片,反而留下了一些无意义的照片。
  在这个大数据的背景下,我们所拥有的数据集合,比以往的任何时刻对我们的研究所产生的影响都要大。而数据的科学性越弱,数据规模和数据的质量就越可能呈现负相关,此时时间本身就成为更加重要的过滤工具。我们如果不仔细选择过去保存下来的有价值、有意义的事物,它们就会被迅速膨胀的信息洪流悄无声息地吞没掉。
  因此,如果我们正在大数据中寻找一些可以告诉我们未来将会是如何发展的依据,我们需要知道当前的数据中什么是重要的,我们需要冲洗掉那些不重要的东西。新鲜的事物更能吸引我们的眼球,但却不一定重要,我们需要克服这一点。
  我们常用的搜索工具的算法基本上还是偏向于新鲜事物的,越近期发生的越排得靠前,越容易被我们所看到。而那些以往的旧闻,很可能点击进去后已经变成了失效的网址。也许我们应该考虑设计一个智能程序,使得信息系统能够变通,懂得忽略不重要但卻是最近产生的信息。
  大数据时代机遇与挑战并存,我们要善于利用我们所拥有的数据,应该懂得只分析那些有意义的数据,以质为主而不是以数取胜。数据只会如滚雪球一般越来越大,懂得主动选择放弃哪些事情,与选择做何事同样重要。
其他文献
美好的“飞车梦”  人们对于快捷出行的追求从来没有停止过,汽车便是人们实现快捷出行时最爱用的工具。一百多年来,汽车已经被人们打造得近乎完美,它们不仅停靠方便、乘坐舒适,而且跑得飞快,爬山涉漠亦如履平地。但即使如此,汽车出行仍然有些不尽人意之处。比如,汽车必须沿着公路行进,遇到河流、建筑等阻碍需绕来绕去,常常要跑不少冤枉路;又比如,在人口密集的大城市,交通拥挤的问题越来越严重,人们在上下班时常常堵在
期刊
烟花不单是浪漫  逢年过节,重大庆典,烟花礼炮是少不了的。当我们欣赏绚烂烟花时,可曾想过美丽背后的科学?  实际上,所谓的鞭炮烟花就是炸药,某些化学物质混合、爆炸,而产生了一时的声响、火焰和色彩。烟花通常包含氧化剂和燃料,它们就是引起爆炸的化学混合物。点火引燃后,即给予了足够的热量,氧化剂和燃料就开始反应,产生热量、烟雾,还有其他看不见的生成物,包括二氧化碳、一氧化碳、水蒸气和氮气。  有的鞭炮烟
期刊
美国人达夫·戈德曼是一个糕点师,但他做的很多蛋糕可以像宇宙间任何一种东西,就是不像蛋糕。DNA链、“千年隼”号宇宙飞船(《星球大战》电影中的一艘太空走私船)、教堂、怪兽、冒着烟的火山;还有许多名人,如奥巴马、猫王。在一次节目中,戈德曼和他的团队一起制作了一个《哈利·波特》电影中的城堡,影片主角的扮演者丹尼尔·雷德克里夫说,“下次直接拿你的蛋糕去做我们的拍摄模型就好了。”其逼真度让人难以相信这些东西
期刊
我们对于人的评价总是容易设标准、找参数,智商和情商是对一个人最简单也最粗鲁的评价标准。  智商:数字就能说明问题?  智力表现在多个方面,如观察力、记忆力、想象力、创造力、分析判断能力、思维能力、应变能力、推理能力等。而智商则是通过一系列标准测试测量人在其年龄段的认知能力所得到的结果,我国一般常用美国心理学家韦克斯勒1955年编制的智力量表来测算智商,得分在90~109属于正常水平,高于130就是
期刊
智能手机普及,使地图用起来也日益简便。它浓缩进手机里,给出行带来了极大便利。但是很早以前完全不是这样,甚至有时候,地图根本就不是为了给人指路。  象征权力的地图  人类使用地图的历史大约有3000年。除石器、刀具等工具外,地图也是早期人类探索世界时发明的一种工具。  仿佛有某种巧合,现存最古老的地图,其形状和大小与现在的苹果手机非常类似。它就是古巴比伦的世界地图,约公元前700年~公元前500年间
期刊
想象一下,与老虎谈天,和猎豹闲聊,正如古代的公冶长听得懂鸟语一样,那将是多么有趣的事情。然而,以善于把玩“黑科技”著称的美国亚马逊公司表示,这并不完全是天方夜谭。  其实,在2017年4月1日愚人节那一天,亚马逊公司就曾以开玩笑的口气在官网推出一款叫做“Petlexa”的新产品,吸引了不少眼球。所谓Petlexa,其实是一种宠物语音助手,它的硬件搭载在亚马逊的Echo智能音箱上。亚马逊Echo是一
期刊
你有没有听过“防火墙”“攻击”“防御”“护盾”这些名词?这些看起来应该是在战争时的用语,现在反倒更常在网络上使用。上至国家信息安全,下至我们个人生活,随着我们对网络的依赖性日渐增强,网络安全带来的挑战也变得越发严峻。  生物学提供的灵感  除了战争用语以外,还有一个我们经常用来类比网络安全的学科:生物学。近年来,计算机科学家们从生物的免疫机理中获得了许多关于网络安全的灵感。我们常说电脑感染了病毒,
期刊
在这个世界上,什么样的人想要“人间蒸发”?想要逃离现实的人会有着不同的理由:也许是因为向政府做了公司的检举人,虽有可观的报酬但害怕招致那些利益受损者的报复;也有可能是因为忍受不了来自丈夫残酷的家庭暴力,因此希望摆脱恶魔;又或许是一个生活在公众眼底下的富翁,期望家人的生活能有足够的隐私,以免被一些不法分子找到要挟的把柄……  在互联网出现之前,如果你想要将自己隐藏起来,是非常简单的,可是在今天这样的
期刊
尽管拉肚子像感冒一样十分常见,但是关于腹泻这个问题,我们还是有许多不知道的地方。我们想出了一些办法来止泻,但是这样治疗对身体真的是好事吗?  一个国际研究小组试图弄清楚为什么身体会让多余的水分进入粪便,产生拉肚子的现象。这项研究有助于帮助我们了解腹泻产生的机制,以及出现腹泻应该如何治疗。  科学家用小白鼠进行了相关实验。肠道的肠壁有着与皮肤组织类似的细胞,少量的水分子可以穿过这些细胞,从肠壁细胞间
期刊
改革开放几十年来,中国虽然还没有培养出获得诺贝尔奖的顶尖科学家,但无数青年精英负笈留学,他们一部分学成归国,还有一部分已经成为海外学界的顶尖科学家,研究成果举世瞩目,国内对他们的情况却知之甚少。  从少年天才到与诺奖擦身  庄小威是个天才少年,15岁时考入中国科学技术大学少年班。在她只有6岁时,她的第一堂物理课就开始了。她父亲是物理学教授,有次他指着桌上的一块物体问她,它既受到桌子的支撑作用,又受
期刊