论文部分内容阅读
在1972年至1974年间,英国进行了一项有关甲状腺疾病与心脏病的?题研究,20年后又进行了后续的追踪调查,于1996年作出的某份调查报告中对被调查妇女是否抽烟与被调查妇女是否存活的数据作了统计分析,部分数据如表1(死亡率精确到0.01%),已知表中的统计数据准确并且统计方法无误,
从表中不难看出,不抽炯者的死亡率明显高于抽娴者,这样的统计结论碌然令人迷惑,难道抽炯的人比不抽炯的人还长寿?这究竟是怎么回事呢?现在就为大家揭开谜底,原来,这项调查忽略了一个重要的条件——年龄,换句话说,收集数据时没有把被调查人群按年龄进行分类,而这一点是非常必要的,因为年龄大的人通常对自己的健康比较关注,常常能做到不抽烟,因此在这类高龄人群中就很少有抽娴者,可上面的调查没有注意这一点,把这类人一并纳入统计数据中,就产生了问题,涮查者意识到失误后进行纠正,把调查对象按年龄分类后得到表2,其中用“ ”表示抽炯,“一”表示不抽娴,
从表2中可以看出,当初75岁以上的老人20年后无一存活,这很容易理解,也就是说,经过20年,当初被调查的老龄人是否抽烟对存活率基本没有影响,弄清了这一点,就可以对表2再次进行修正,考虑到65岁以上妇女的死亡更多是因为身体老化和功能衰竭,所以将表2中65岁以上的数据删除,从而得到更为精确和合理的表3(死亡率精确到0.01%),
从表3中可以看出,在不满65岁的妇女中,抽烟者的死亡率明显高于不抽烟者,符合生活实际与常规判断,
这个故事是不是挺耐人寻味?它给我们的启发是:虽然“数据会说话”,但若选取的原始数据品质不佳,或对数据处理不当,就可能会出现错误,因此,我们在统计分析时,必须注意可能忽视的背景和细节,综合考虑各种因素,这样得到的结论才能更准确,
从表中不难看出,不抽炯者的死亡率明显高于抽娴者,这样的统计结论碌然令人迷惑,难道抽炯的人比不抽炯的人还长寿?这究竟是怎么回事呢?现在就为大家揭开谜底,原来,这项调查忽略了一个重要的条件——年龄,换句话说,收集数据时没有把被调查人群按年龄进行分类,而这一点是非常必要的,因为年龄大的人通常对自己的健康比较关注,常常能做到不抽烟,因此在这类高龄人群中就很少有抽娴者,可上面的调查没有注意这一点,把这类人一并纳入统计数据中,就产生了问题,涮查者意识到失误后进行纠正,把调查对象按年龄分类后得到表2,其中用“ ”表示抽炯,“一”表示不抽娴,
从表2中可以看出,当初75岁以上的老人20年后无一存活,这很容易理解,也就是说,经过20年,当初被调查的老龄人是否抽烟对存活率基本没有影响,弄清了这一点,就可以对表2再次进行修正,考虑到65岁以上妇女的死亡更多是因为身体老化和功能衰竭,所以将表2中65岁以上的数据删除,从而得到更为精确和合理的表3(死亡率精确到0.01%),
从表3中可以看出,在不满65岁的妇女中,抽烟者的死亡率明显高于不抽烟者,符合生活实际与常规判断,
这个故事是不是挺耐人寻味?它给我们的启发是:虽然“数据会说话”,但若选取的原始数据品质不佳,或对数据处理不当,就可能会出现错误,因此,我们在统计分析时,必须注意可能忽视的背景和细节,综合考虑各种因素,这样得到的结论才能更准确,