论文部分内容阅读
【摘 要】本文基于P值在统计学中的特殊意义,从假设检验、正态分布、P值的含义、统计显著性四个维度出发,结合某个披萨店平均配送时间是否会大于30分钟的具体案例,对P值的统计学意义进行分析阐述,最后指出P值还在SPSS软件分析问卷数据等方面发挥着的不可替代的作用,它所蕴含的重要价值值得广大研究者对其进行更多角度的深度挖掘。
【关键词】假设检验;正态分布;P值;统计显著性
【中图分类号】G633.6 【文献标识码】A 【文章编号】1671-8437(2019)34-0021-02
在统计学P中,P值具有特殊的意义,在解析几何乃至某些实验中,P值同样成为决策工具的一部分,如当超过的阈值时,意味着P值为0.0000003才能确认发现了希格斯玻色子。下面将分别从假设检验、正态分布、P值的含义、统计显著性这四个方面解释P值的意义以及如何在统计学中使用P值。
1 假设检验
在假设检验中,通常采用P值来确定结果的统计显著性[1]。由于最终目标是确定结果的统计显著性,统计显著性需要建立在假设检验、正态分布、P值这三个简单概念之上。所以,假设检验是通过一组数据检验零假设的有效性,倘若零假设不成立,此时就会相信备择假设。换句话说,就是需要提出零假设,并用样本数据来检验声明是否有效。倘若零假设无效,则选择备择假设。而要想确定零假设是否有效,就要运用P值来衡量证据的强度,从而了解它是否有统计显著性。如果证据支持备择假设,那么就会拒绝零假设并接受备择假设。
举个典型的例子:假设某个披萨店声称他们的平均配送时间小于或等于30分钟,但这里认为他们的配送时间不止30分钟,所以做了假设检验,对配送时间采用随机采样来检验这一说法:零假设——平均配送时间小于等于30分钟;备择假设——平均配送时间大于30分鐘。这里的目标是确定样本数据中的证据能更好地支持哪种假设(零假设还是备择假设)。本例中使用的是单尾检验,这里只想知道平均配送时间是否多于30分钟,因为配送时间小于或等于30分钟都是可以接受的,因此可忽略另一个方向的可能性,换句话说就是想弄清楚披萨店是否在某种角度上欺骗了消费者。
2 正态分布
正态分布是一种用来观察数据分布的概率密度函数,它包含两个参数——平均值μ和标准差σ。其中,平均值代表着数据分布的集中趋势,决定了正态分布峰值的位置;标准差则是衡量可变性的标准,决定了均值的下降幅度。正态分布通常68-95-99.7和规则相关:68%的数据在平均值μ±1个标准差σ内;95%的数据在平均值μ±2个标准差σ内;99.7%的数据在平均值μ±3个标准差σ内。
Z分数越高,结果就越不可能偶然发生;Z分数越低,结果就越可能有意义。但多高或多低才足以说明结果是有意义的呢?这就是解决这个难题的最后一片拼图——P值,需要根据实验开始前设定的显著水平检验结果是否具有统计学意义。
3 P值的含义
对披萨配送时间随机采样的目的是检查平均配送时间是否大于30分钟,如果最终的结果支持披萨店的说法,即平均配送时间小于或等于30分钟,那就表示接受零假设,否则就是拒绝零假设。假如生活在披萨配送时间小于或等于30分钟,即零假设成立的世界中,那在真实世界中得到的证据有多令人惊讶?P值用数字(概率)回答了这一问题:P值越低,证据越令人惊讶、零假设越荒谬。当零假设很荒谬的时候还能做什么?可以拒绝零假设并选择备择假设,如果P值低于之前定义的显著水平,那么它属于荒谬阈值,可以拒绝零假设。
如现在已经抽样得到了一些配送时间,计算后发现平均配送时间要多10分钟,P值为0.03,这意味着在比萨配送时间小于或等于30分钟的世界中,由于随机噪声的影响,有3%的概率会看到比萨配送时间延长了至少10分钟。由于P值越低,结果越有意义,所以它不太可能是由噪声引起的。很多人对P值存在误解:P值为0.03意味着有3%的概率是偶然决定的——这是错误的,因为P值不能证明任何事,它只是一种根据惊讶程度做出合理决策的基础方法。那么利用0.03的P值来做出合理决策则需要以下几步:①想象生活在平均配送时间小于或等于30分钟的世界。②分析收集的配送时间样本后,P值为0.03,低于0.05的置信水平,因此可以说结果是具有统计显著性的。③因为一直相信比萨店可以在30分钟内配送比萨,现在需要考虑的是这一信念是否仍然有意义,因为结果说明了比萨店没能兑现承诺,而且结果是具有统计学意义的。④这时先试着用各种方法使初始信念成立,但由于比萨店的口碑越来越差,因此决定拒绝零假设。⑤最终做出不再从这家比萨店买比萨的合理决定。
不难发现在上面的例子中,P值不能证明或决定任何事。当结果有统计学意义时,P值可以作为挑战初始信念的工具。假设P值表明结果具有统计显著性,在认为信念荒谬的那一刻就放弃了自己的初始信念,即拒绝零假设,并做出了更合理的决定。
4 统计显著性
通过对上述假设检验、正态分布、P值含义、统计显著性四个维度的分析可知P值在统计学中具有非凡的意义,更是SPSS软件分析问卷数据时的重要指标,值得广大研究者对其进行深入探究。
【参考文献】
[1]阮征.影响初中生数学运算能力提升的因素调查研究[D].合肥:合肥师范学院,2018.
[2]卫德彬,阮征,陈方勇,等.智慧学校环境下习题课教学与初中生数学成绩关联性实验研究[J].中小学电教,2019(6).
【作者简介】
阮征(1992~),女,汉族,学历:硕士研究生,研究方向:数学课程与教学论。
孔德飞(1977~),男,汉族,中学一级教师,研究方向:初中数学教学。
【关键词】假设检验;正态分布;P值;统计显著性
【中图分类号】G633.6 【文献标识码】A 【文章编号】1671-8437(2019)34-0021-02
在统计学P中,P值具有特殊的意义,在解析几何乃至某些实验中,P值同样成为决策工具的一部分,如当超过的阈值时,意味着P值为0.0000003才能确认发现了希格斯玻色子。下面将分别从假设检验、正态分布、P值的含义、统计显著性这四个方面解释P值的意义以及如何在统计学中使用P值。
1 假设检验
在假设检验中,通常采用P值来确定结果的统计显著性[1]。由于最终目标是确定结果的统计显著性,统计显著性需要建立在假设检验、正态分布、P值这三个简单概念之上。所以,假设检验是通过一组数据检验零假设的有效性,倘若零假设不成立,此时就会相信备择假设。换句话说,就是需要提出零假设,并用样本数据来检验声明是否有效。倘若零假设无效,则选择备择假设。而要想确定零假设是否有效,就要运用P值来衡量证据的强度,从而了解它是否有统计显著性。如果证据支持备择假设,那么就会拒绝零假设并接受备择假设。
举个典型的例子:假设某个披萨店声称他们的平均配送时间小于或等于30分钟,但这里认为他们的配送时间不止30分钟,所以做了假设检验,对配送时间采用随机采样来检验这一说法:零假设——平均配送时间小于等于30分钟;备择假设——平均配送时间大于30分鐘。这里的目标是确定样本数据中的证据能更好地支持哪种假设(零假设还是备择假设)。本例中使用的是单尾检验,这里只想知道平均配送时间是否多于30分钟,因为配送时间小于或等于30分钟都是可以接受的,因此可忽略另一个方向的可能性,换句话说就是想弄清楚披萨店是否在某种角度上欺骗了消费者。
2 正态分布
正态分布是一种用来观察数据分布的概率密度函数,它包含两个参数——平均值μ和标准差σ。其中,平均值代表着数据分布的集中趋势,决定了正态分布峰值的位置;标准差则是衡量可变性的标准,决定了均值的下降幅度。正态分布通常68-95-99.7和规则相关:68%的数据在平均值μ±1个标准差σ内;95%的数据在平均值μ±2个标准差σ内;99.7%的数据在平均值μ±3个标准差σ内。
Z分数越高,结果就越不可能偶然发生;Z分数越低,结果就越可能有意义。但多高或多低才足以说明结果是有意义的呢?这就是解决这个难题的最后一片拼图——P值,需要根据实验开始前设定的显著水平检验结果是否具有统计学意义。
3 P值的含义
对披萨配送时间随机采样的目的是检查平均配送时间是否大于30分钟,如果最终的结果支持披萨店的说法,即平均配送时间小于或等于30分钟,那就表示接受零假设,否则就是拒绝零假设。假如生活在披萨配送时间小于或等于30分钟,即零假设成立的世界中,那在真实世界中得到的证据有多令人惊讶?P值用数字(概率)回答了这一问题:P值越低,证据越令人惊讶、零假设越荒谬。当零假设很荒谬的时候还能做什么?可以拒绝零假设并选择备择假设,如果P值低于之前定义的显著水平,那么它属于荒谬阈值,可以拒绝零假设。
如现在已经抽样得到了一些配送时间,计算后发现平均配送时间要多10分钟,P值为0.03,这意味着在比萨配送时间小于或等于30分钟的世界中,由于随机噪声的影响,有3%的概率会看到比萨配送时间延长了至少10分钟。由于P值越低,结果越有意义,所以它不太可能是由噪声引起的。很多人对P值存在误解:P值为0.03意味着有3%的概率是偶然决定的——这是错误的,因为P值不能证明任何事,它只是一种根据惊讶程度做出合理决策的基础方法。那么利用0.03的P值来做出合理决策则需要以下几步:①想象生活在平均配送时间小于或等于30分钟的世界。②分析收集的配送时间样本后,P值为0.03,低于0.05的置信水平,因此可以说结果是具有统计显著性的。③因为一直相信比萨店可以在30分钟内配送比萨,现在需要考虑的是这一信念是否仍然有意义,因为结果说明了比萨店没能兑现承诺,而且结果是具有统计学意义的。④这时先试着用各种方法使初始信念成立,但由于比萨店的口碑越来越差,因此决定拒绝零假设。⑤最终做出不再从这家比萨店买比萨的合理决定。
不难发现在上面的例子中,P值不能证明或决定任何事。当结果有统计学意义时,P值可以作为挑战初始信念的工具。假设P值表明结果具有统计显著性,在认为信念荒谬的那一刻就放弃了自己的初始信念,即拒绝零假设,并做出了更合理的决定。
4 统计显著性
通过对上述假设检验、正态分布、P值含义、统计显著性四个维度的分析可知P值在统计学中具有非凡的意义,更是SPSS软件分析问卷数据时的重要指标,值得广大研究者对其进行深入探究。
【参考文献】
[1]阮征.影响初中生数学运算能力提升的因素调查研究[D].合肥:合肥师范学院,2018.
[2]卫德彬,阮征,陈方勇,等.智慧学校环境下习题课教学与初中生数学成绩关联性实验研究[J].中小学电教,2019(6).
【作者简介】
阮征(1992~),女,汉族,学历:硕士研究生,研究方向:数学课程与教学论。
孔德飞(1977~),男,汉族,中学一级教师,研究方向:初中数学教学。