论文部分内容阅读
量化人生与数据谎言
约莫一两个世纪前,数据相当于弄虚作假的代名词。当时西方流行一句谚语:“谎言有三种:谎言、该死的谎言,以及数据。”
过去人们不信任数据,一方面是不信任数据源—数据收集者未必能足够可靠地收集到充足数据;另一方面是不信任数据处理—数据分析者未必能毫无瑕疵地秉公处理数据。数学家尝试解决这个问题,他们提出样本量、标准差、置信空间等一系列概念,指出怎样的数据值得借鉴、怎样的数据纯属胡扯。