一秒钟看穿统计陷阱

来源 :中国科技教育 | 被引量 : 0次 | 上传用户:xieyuchun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  “随机调查了100位网友,有87.53%的网友同意……”嗯?等等。呃,糊弄鬼呢!“哦,不好意思,看错了,是130位网友……”哦,这样……嗯?再等等……
  正所谓“流氓懂科学,谁也挡不住”。如今越来越多的复杂统计数据像潮水般向我们涌来,一批又一批的调查结果,都显得那么铿锵有力,似乎那就是客观事实。统计陷阱被科学流氓们包装得越发完美,一不小心就把我们忽悠了。该怎么办呢?别急,且看死理性派现身说法,帮大家理清真相。
  抽样调查,想说无偏不容易
  调查问卷你肯定知道,多半还做过。在统计上,问卷调查属于抽样调查。再大规模的抽样调查,都可能存在着意想不到的陷阱。不妨让我们穿越到1936年的美国,看1个被许多书本都引用过的实例吧。
  1936年,美国总统大选在即,当时1本著名杂志《文学文摘》就在读者中做了1次问卷调查,断言共和党的兰登即将以57%对43%的绝对优势大胜民主党的罗斯福——这可是根据240万份调查问卷得到的结果。这么大规模的调查,如同宣告了兰登的胜利,可是,最后的结果却让人大跌眼镜:罗斯福以62%的支持率成功连任美国总统。出现了这个戏剧性的丑闻后,《文学文摘》业绩直接掉落为零,最后竟然倒闭了。对于《文学文摘》来说,他们的问题出在哪里呢?
  现在看来,《文学文摘》的调查问卷虽然数量庞大,但是样本构成大有问题。首先,最可能看到这个调查的是这个杂志的常客,而他们参加调查的动机各有不同。另外,这个话题更能引发人的兴趣,有些则只是很少的人关心。这都会导致最终参加调查的人是1个有偏的样本。结论可能代表了这些人群,却不能推广到全体。
  其次,问卷的回收率只有24%,忽略那些没有被回收的问卷就等于是忽略了剩余760万人的意见。《文学文摘》杂志社还通过电话调查的方式对自己的读者进行了抽样,但在1936年,并不是每一个家庭都能装得起电话——那些订阅杂志、用电话的人家往往都是有钱的人,他们并不能代表全美国的选民意见。最终,这些看起来不算起眼的问题对他们的预测结果产生了巨大影响,事情的发展也走向了完全相反的方向。
  如果我们现在做一个调查,看一看在最初恢复高考的3年中进入几所名牌大学就读的学生如今的年收入,你一定会得到一个高得吓人的数字。我敢如此肯定并不是我熟悉他们的社会成就,而是因为我了解调查的缺陷。可以想见,当年的那些大学生虽然有案可查,但能够准确联系调查的却只有一部分较为成功的人了。其中有一些人虽然联系上了,却不一定愿意接受调查。最后,还不能排除一些人受赞许倾向的影响,有意无意地提高报告自己的收入水平。最终,调查员只回收了那些成功人士的数据,而沉默的大多数却被“统计式”地忽视了。
  图表里的玄机
  为了让没有直接接触数据的人也能直观地感受到其中的一些信息,人们发明了各种各样漂亮的统计图表。但是就是“客观”的图表里面也存在着各种各样的陷阱。
  在制作统计图表时,一个常用的欺骗手法便是改变统计图形的坐标尺度,从而改变了整个图形的陡峭程度。《统计陷阱》一书中就曾举过这样一个例子。下图反映了某年9月27日某时的黄金价格走势。
  左面2幅图描述的是相同时间段的黄金价格走势,显然,左边的金价急升更容易让人产生激动的心情。右边将左边的图横向拉长了,使得它看起来是在更短的时间内冲上高峰,即使标出了横纵轴的刻度,这2幅图给普通人留下的第一印象也大不一样。
  当然,还有比拉伸图表更隐蔽的手法。现在我们手上有一组罗坦提亚和美国的木匠平均周收入数据,如果做成条形图就像下页左侧的那幅图那样。
  看得出来,美国木匠的平均收入是罗坦提亚木匠的2倍。但通常为了视觉效果,它会被做成更形象的卡通图。这其实却暗中改变了人们对这个统计事实的印象。
  美国人的钱袋长、高都是罗坦提亚木匠的2倍,看起来挺忠实于数据的,但是右边钱袋实际占用的面积就是左边的4倍。这幅图像导致的暗示效果其实还没完,因为在生活中钱袋都是立体的,所以每个读者看到这个钱袋的时候会不经意地给它加上一个厚度,这样一来,在有些人眼里这幅图表达的明明是美国木匠的收入是罗坦提亚木匠的8倍——这样的印象完全脱离了原始数据所给出的信息,无疑是一次成功的误导。
  如何练就火眼金睛
  上面说了几个很容易让公众迷惑的统计陷阱,那当我们看到各类统计数字时,应该如何判断它是否客观呢?
  首先要细心寻找统计中的偏差。比较明显的是在描述上有意识进行的偏差。比如滥用平均数等带来的问题:“我们工厂3000人,月平均工资有5000块。”看起来比较不错的待遇,实际上可能是一个月薪100万的老总加上每个月拿着可怜薪水的上千名工人简单平均起来的结果。同时报道中常常声称的“升高”和“下降”并不一定真的如此。在面对类似“这段时间气温异常升高,热浪持续1周导致城市死亡人数激增至300人”这样的标题时,我们往往要小心这里所说的“激增”是否属实。一个一定规模的城市在一周内有300人死亡并不算是异常的数字,而热浪实际上是一个没有起多大作用的因素。半个世纪以前,纽约市的2份报纸上面刊登的犯罪数量一度达到了令人发指的水平,迫于舆论压力,当时的警察联合会主席不得不有所表示,但是他仅仅采用了一个行动就平息了这场风波——他解雇了2名编辑,因为这场风波是他们在互相竞争着挖掘犯罪事件并搬上台面,导致对民众产生误导。事实上,警察局的统计数据表示这段时间的犯罪事件数量并没有上升。
  其次我们要寻找潜伏着的无意识偏差,这种偏差带来的结果往往影响更深远——《文学文摘》就是无意识偏差的受害者。无意识偏差常常会体现在对样本的选取不注意上。一个超市对100名顾客进行了调查,得出了“75%的人声称喜欢喝茶而不是咖啡”的结论,那么我们大可不必去相信这个结论,因为相比起总数来说,100个人实在是微不足道的。这家超市也发现了这个问题,接着发出10000份调查问卷,最后回收了2300份,发现“64%的人声称喜欢喝茶而不是咖啡”,这个结论毫无疑问也不能令人信服。实际上这个调查体现出来的是有1472个人更喜欢喝茶,828个人更喜欢喝咖啡,但是还有剩下7300个人没有给出答案——这是光看结果分析的读者所无法知道的,所以不能简单地相信一个直接而草率的结论。
  最后我们要注意保持对统计图示和统计数据的敏感性。图标会有意无意地通过巧妙设计(比如横纵轴的尺度问题),从而使得这幅图凸显的内容就是作者期望读者能够收到的信息。在观看图表的时候,我们可以试图在脑海中想象出与图像所对应的具体数据,只要图像不是捏造的,那么就能够在一定程度上摆脱视觉上的误导。然而白底黑字的统计数字又怎么会出错呢?捏造的数字当然是错误的。比如当年闹得沸沸扬扬的“87.53%事件”
  (指一则谣言称在随机调查的100名网友中,有85.7%支持某事),但如果报道中提到的被调查人数是130人,不知道还会有多少人能发现这个数据不正确?113个人表示支持的话,那么支持率是86.92%,114个人表示支持的话,那么支持率是87.69%——无论如何也得不到87.53%的数据,但是这样造假的数据却大大提高了可信度,让人难以发现其中的谬误了。实际上,很多的假数据都利用到了人们天生对“精确的数字”的信任——“在校大学生每日开销大约为50元”的说法就不如“在校大学生每日开销为51.74元”更显真实。仔细想想,我们每天接触着海量的信息,身边有多少数据是这样以假乱真的呢?
  或许对于那些统计学家来说,只有下面这幅图才让人感到一点点的安心吧!
  参考资料:
  《统计陷阱》【美】达莱尔·哈夫
其他文献
学术随笔是学者们就学术研究过程中相关问题所撰写的札记、杂谈,含有一定的专业知识和学术火花。它少了几分深奥、严肃,变得灵动、活泼,以闲适轻松、优美隽永的文体记录学术研究
北京非首都功能疏解集中承栽地、继深圳经济特区和上海浦东新区之后又一具有全国意义的新区、北京与河北发展的“两翼”之一……横空出世的雄安新区,不仅承栽着人们的希望,也带
有一种民间舞蹈,产生于'逃荒路上',演的却是'六合同春'。一方水土养一方人,在柔韧刚强的'井陉拉花'背后,是一辈辈饱经沧桑的山里人对美好生活的热切
2016年初春时节,毗邻东北的秦皇岛市青龙县干沟乡依然寒气袭人。天虽冷,却挡不住省委宣传部驻村扶贫工作队火一样的热情。带着省委宣传部的嘱托,肩负着带领村民脱贫攻坚的重
2008年9月25日,全世界的目光再一次聚焦在大漠深处的酒泉卫星发射中心,17点35分,“神舟”七号承载着无数中国人的梦想飞向太空,在此次“神舟”飞船在轨过程中,航天员翟志刚还顺利完成了19分35秒的出舱活动。  茫茫太空第一次留下了中国人的足迹,第一次飘起了鲜艳的五星红旗。这是一次开创中国航天新纪元的漫步,也是中国人和平利用太空的一大步,中国随之成为世界上第三个掌握空间出舱活动技术的国家。  中
针对农村党组织党内生活中存在的理论知识薄弱问题,今年以来,邱县实行基层党建指导员制度,全县选派218名“党建指导员”到基层组织指导党建工作,实现农村基层党支部全覆盖,开启了
2010年元宵节那天,9岁小女孩扣子和家人一起吃午饭的时候,忽然听见有人叫她。征得家人的同意,扣子拿起一个小空瓶就和好朋友会合去了。  在扣子家居住的小区附近有一口水井,扣子经常和小朋友去那里玩一种特别的游戏:就是把空瓶子放下去,再把水吊上来。这次,扣子就是和小朋友们一起玩这个游戏。冬天,井里的水位下降很多,绳子似乎不够长,于是扣子就尽量往下够,忽然脚底打滑,她一下失去平衡,栽了下去。意外发生后,
英特尔求知计划项目自2003年在内蒙古自治区实施以来,已逐渐发展为青少年社区项目中的一个品牌。目前有6个盟市的24个项目执行单位开展此项活动,2010年还与山西省共同成为全国“求知计划”农村试点项目单位之一,在自治区4个盟市开展农村试点活动。为提高自治区求知计划项目教师能力,推动农村试点工作的深入开展,内蒙古青少年科技中心于11月23~24日在呼和浩特市举办了2010年求知计划教师研修班暨农村试点
近年来,徐州农行党委高度重视农业银行企业文化的建设工作,以构建和谐农行为主线,扎实推进理念培育、形象规范和文化深植,企业文化建设取得良好效果。本文提炼和总结徐州农行
贺修平在2016年9月12日《人民日报》撰文认为,党的十八大以来,我们党以猛药去病、重典治乱的决心,以刮骨疗毒、壮士断腕的勇气,有力打击腐败行为,党风廉政建设和反腐败斗争成效显