论文部分内容阅读
摘要:从参数的区间估计角度审视假设检验问题,剖析知识点的内在联系,梳理置信区间与假设检验中的拒绝域之间的关系,认为可以用置信区间进行假设检验。
关键词:区间估计;置信区间;抽样分布;假设检验
中图分类号:G642.0文献标识码:A
Assumption of Confidence Interval Method
LiuSubing1CaoDazhi1ZhangHua2
1.Rocket Force University of EngineeringShanxiXi’an710025;
2.The Hitech College ofXi’an University of TechnologyShanxiXi’an710109
Abstract:The hypothesis test is analyzed from the perspective of the interval estimation of the parameters,the internal relations of the knowledge points are analyzed,the relationship between the domains in the confidence interval and the hypothesis test is combed.Finally,the hypothesis test is carried out in the confidence interval.
Key words:interval estimation;confidence interval;sampling distribution;hypothesis test
数理统计中的重点内容就是利用样本信息对总体参数进行某种推断和预测,其中有两个重要的组成部分是参数估计和假设检验。从推断角度上看,参数估计时,估计前总体参数是未知的,主要讨论用样本统计量对总体参数进行估计;假设检验时,则是先对未知参数提出一定的假设,然后再利用样本信息去检验所提假设是否成立。虽然考虑问题的出发点不同,但在参数的区间估计和假设检验这两部分学习中,仔细观察发现有诸多相似之处:均用到了正态总体的抽样分布、假设检验中的检验统计量同置信区间的枢轴量相似、都有一个给定的α。那么它们之间有没有联系呢?很多同学在学习中都存在这样的困惑。进一步讲,除了假设检验本身方法外,能不能用区间估计中的置信区间来进行假设检验呢?
在参数的置信区间估计中,记1-α为置信度,反映区间估计的可信度,α为置信水平,在置信水平下,利用样本信息对未知参数进行估计,并以1-α的概率保证总体参数落在该区间内,α越小,置信区间也就越宽。在假设检验中,一旦显著性水平α和检验统计量确定,临界值的位置也就确定了。比如,在对总体均值α进行假设检验时,由对应临界值所围成的区域组成以μ0为中心的置信区间,因此,是否可以接受原假设μ=μ0,取决于μ的统计量是否落在这个区间内。若原假设H0∶μ=μ0为真,则在假设下,自然认为μ的统计量几乎不可能落在置信区间外,而若落在外面,就认为小概率事件发生了,利用“小概率原理”,则推断H0为假,从而拒绝H0。α越小,置信区间就越宽,从而使得犯“弃真错误”可能性变小。因此,可以用置信区间进行假设检验。
1 用置信区间进行假设检验
设X1,X2,…,Xn来自正态总体N(μ,σ2)的样本,讨论σ2已知关于均值μ的检验问题。分三种情况:
①H0∶μ=μ0H1∶μ≠μ0(双侧检验)
②H0∶μ≤μ0H1∶μ>μ0(右侧检验)
③H0∶μ≥μ0H1∶μ<μ0(左侧检验)
其中,μ0已知,总体方差σ2分已知和未知讨论。讨论在σ已知情况下假设问题。
①H0∶μ=μ0H1∶μ≠μ0(双侧检验)
在α下的检验的接受域为:
W-1=|U|≤uα/2=X--μ0σ/n≤uα/2,
此接受域可改写成
W-1=X--μ0≤uα/2σn=X--uα/2σn≤μ0≤X-+uα/2σn,其中μ0并无限制,若让μ0在(-∞,+∞)内取值,就得到μ的置信度1-α置信区间:X-+uα/2σn。
反之,若有一个如上的置信度1-α的置信区间:,也可以获得关于H0∶μ=μ0H1∶μ≠μ0的显著性水平为α的显著性检验。因此,正态均值μ的1-α的置信区间与关于H0∶μ=μ0H1∶μ≠μ0的双侧检验问题的显著性水平为α的显著性检验一一对应。
正态总体均值μ的置信區间由点估计值和描述估计量精度的边际误差两部分组成,记允许误差为Δ=uα/2σ[]n,可得,利用置信区间进行双侧假设检验的决策为:
若|X-μ0|≤Δ,不能拒绝H0;若|X-μ0|>Δ,拒绝H0。
②H0∶μ≤μ0H1∶μ>μ0(右侧检验);
在显著性水平μ下的检验的接受域为:
,这就给出了参数μ的1-α的置信上限。反之,对上述给定的μ的1-α的置信上限,我们也可以得到关于H0∶μ≤μ0H1∶μ>μ0的单侧检验问题的显著性水平α的检验,它们之间具有一一对应关系。
对于单侧置信区间,记Δ=μασ[]n,于是利用置信区间进行右侧假设检验的决策为:
若X-μ0≤Δ,不能拒绝H0;若X-μ0>Δ,拒绝H0。
③类似于②,对于单侧置信区间,记Δ=uασ[]n,于是利用置信区间进行左侧假设检验的决策为:
若X-μ0>-Δ,不能拒绝H0;若X-μ0<-Δ,拒绝H0。
综上所述,若记允许误差为Δ=uα/2σ[]n(单侧检验中为μασm),则利用置信区间进行假设检验的决策准侧统一概括为: 若|X-μ0|≤Δ,不能拒绝H0;
若|X-μ0|>Δ,拒绝H0.
类似可考虑方差未知时的假设检验问题:若σ未知,用s进行估计,用t代替正态分布即可,见下表。
由上,对同一实例,当进行参数估计和假设检验,用的是同一样本,统计量和分布也相同时,可以利用置信区间进行假设检验。以几个例子作为进一步的说明。
2 若干应用
例1[1]有一种元件,对其平均使用寿命要求是应达1000小时,已知该种元件寿命服从正态分布,标准差为100小时,现从一批这样的元件中,随机抽取了49件,测得其平均寿命是950小时。试确定这批元件是否合格(α=0.05)。
解若使用寿命高于所要求的标准1000小时,自然认为元件为合格品,所以更关心置信下限值,因此,认为这是左单侧下限的检验问题。
H0∶μ≥1000H1∶μ<1000(左侧检验)
当α=0.05时,uα=1.645,置信区间的下限值:
μ0-uασn=1000-1.645×10049=976.5
进行决策示意图如下所示
由上图看出,若样本均值x->976.5,不能拒绝原假设,可以认为这批元件合格;若x-≤976.5,则拒绝原假设,认为这批元件不合格。经计算,本题中x-=950>976.5,故拒绝原假设,认为这批元件不合格。
置信区间中的允许误差Δ=uασn=1.645×10049=23.5,利用置信区间进行假设检验,|x--μ0|=|950-1000|=50,因为|x--μ0|>Δ,所以拒绝H0。
用置信区间进行检验时,好处是可以同时对几个统计量进行检验。例如,从三批这样的元件中分别抽取随机样本,测得使用寿命的均值分别为980,976,970,问这三批元件是否合格?
解由以上讨论,此问题十分简单,若x-i(i=1,2,3)>9765,则认为元件达到合格标准,否则便认为不合格。
例2[1]某种元件寿命记为X(小时),设X~N(μ,σ2),其中,μ,σ2未知,隨机抽取了16只元件,寿命测得如下:
280,264,149,170,101,159,224,168,379,212,179,222,485,362,250,260
问是否可以认为该元件的平均寿命大于225小时?(α=0.05)
解本题σ2未知,是关于μ右单侧上限检验问题。
H0∶μ≤225H1∶μ>225(右侧检验)
置信区间的上限值:μ0+ta(n-1)sn=225+1.7531×98.72616=268.2691
(α=0.05,t0.05(15)=1.7531)
由上图看出,若样本均值x-<268.2691,不能拒绝原假设,可以认为这批元件的平均寿命大于225小时,否则,拒绝原假设。本例中x-=241.5<268.2691,故不能拒绝原假设。
置信区间中的允许误差Δ=tα(n-1)sn=1.7531×98.72616=43.2691,利用置信区间进行假设检验,|x--μ0|=|241.5-225|=16.5,因|x--μ0|<Δ,无充足理由拒绝H0。
参考文献:
[1]贾俊平,何晓群,金勇进,等.统计学(第三版)[M].北京:中国人民大学出版社,2007.
[2]杨萍,敬斌.工程数学(下册)[M].西安:西安电子科技大学出版社,2016.
[3]茆诗松,程依明,濮晓龙.概率论与数理统计教程(第二版)[M].北京:高等教育出版社,2011.
[4]兰冲锋.统计学教学中关于假设检验问题探讨[J].湖南城市学院学报(自然科学版),2016,25(2)303304.
基金项目:陕西省教育厅专项科研计划资助项目(17JK1023)
作者简介:刘素兵(1980),女,河北邢台人,硕士,讲师,主要从事统计研究。
关键词:区间估计;置信区间;抽样分布;假设检验
中图分类号:G642.0文献标识码:A
Assumption of Confidence Interval Method
LiuSubing1CaoDazhi1ZhangHua2
1.Rocket Force University of EngineeringShanxiXi’an710025;
2.The Hitech College ofXi’an University of TechnologyShanxiXi’an710109
Abstract:The hypothesis test is analyzed from the perspective of the interval estimation of the parameters,the internal relations of the knowledge points are analyzed,the relationship between the domains in the confidence interval and the hypothesis test is combed.Finally,the hypothesis test is carried out in the confidence interval.
Key words:interval estimation;confidence interval;sampling distribution;hypothesis test
数理统计中的重点内容就是利用样本信息对总体参数进行某种推断和预测,其中有两个重要的组成部分是参数估计和假设检验。从推断角度上看,参数估计时,估计前总体参数是未知的,主要讨论用样本统计量对总体参数进行估计;假设检验时,则是先对未知参数提出一定的假设,然后再利用样本信息去检验所提假设是否成立。虽然考虑问题的出发点不同,但在参数的区间估计和假设检验这两部分学习中,仔细观察发现有诸多相似之处:均用到了正态总体的抽样分布、假设检验中的检验统计量同置信区间的枢轴量相似、都有一个给定的α。那么它们之间有没有联系呢?很多同学在学习中都存在这样的困惑。进一步讲,除了假设检验本身方法外,能不能用区间估计中的置信区间来进行假设检验呢?
在参数的置信区间估计中,记1-α为置信度,反映区间估计的可信度,α为置信水平,在置信水平下,利用样本信息对未知参数进行估计,并以1-α的概率保证总体参数落在该区间内,α越小,置信区间也就越宽。在假设检验中,一旦显著性水平α和检验统计量确定,临界值的位置也就确定了。比如,在对总体均值α进行假设检验时,由对应临界值所围成的区域组成以μ0为中心的置信区间,因此,是否可以接受原假设μ=μ0,取决于μ的统计量是否落在这个区间内。若原假设H0∶μ=μ0为真,则在假设下,自然认为μ的统计量几乎不可能落在置信区间外,而若落在外面,就认为小概率事件发生了,利用“小概率原理”,则推断H0为假,从而拒绝H0。α越小,置信区间就越宽,从而使得犯“弃真错误”可能性变小。因此,可以用置信区间进行假设检验。
1 用置信区间进行假设检验
设X1,X2,…,Xn来自正态总体N(μ,σ2)的样本,讨论σ2已知关于均值μ的检验问题。分三种情况:
①H0∶μ=μ0H1∶μ≠μ0(双侧检验)
②H0∶μ≤μ0H1∶μ>μ0(右侧检验)
③H0∶μ≥μ0H1∶μ<μ0(左侧检验)
其中,μ0已知,总体方差σ2分已知和未知讨论。讨论在σ已知情况下假设问题。
①H0∶μ=μ0H1∶μ≠μ0(双侧检验)
在α下的检验的接受域为:
W-1=|U|≤uα/2=X--μ0σ/n≤uα/2,
此接受域可改写成
W-1=X--μ0≤uα/2σn=X--uα/2σn≤μ0≤X-+uα/2σn,其中μ0并无限制,若让μ0在(-∞,+∞)内取值,就得到μ的置信度1-α置信区间:X-+uα/2σn。
反之,若有一个如上的置信度1-α的置信区间:,也可以获得关于H0∶μ=μ0H1∶μ≠μ0的显著性水平为α的显著性检验。因此,正态均值μ的1-α的置信区间与关于H0∶μ=μ0H1∶μ≠μ0的双侧检验问题的显著性水平为α的显著性检验一一对应。
正态总体均值μ的置信區间由点估计值和描述估计量精度的边际误差两部分组成,记允许误差为Δ=uα/2σ[]n,可得,利用置信区间进行双侧假设检验的决策为:
若|X-μ0|≤Δ,不能拒绝H0;若|X-μ0|>Δ,拒绝H0。
②H0∶μ≤μ0H1∶μ>μ0(右侧检验);
在显著性水平μ下的检验的接受域为:
,这就给出了参数μ的1-α的置信上限。反之,对上述给定的μ的1-α的置信上限,我们也可以得到关于H0∶μ≤μ0H1∶μ>μ0的单侧检验问题的显著性水平α的检验,它们之间具有一一对应关系。
对于单侧置信区间,记Δ=μασ[]n,于是利用置信区间进行右侧假设检验的决策为:
若X-μ0≤Δ,不能拒绝H0;若X-μ0>Δ,拒绝H0。
③类似于②,对于单侧置信区间,记Δ=uασ[]n,于是利用置信区间进行左侧假设检验的决策为:
若X-μ0>-Δ,不能拒绝H0;若X-μ0<-Δ,拒绝H0。
综上所述,若记允许误差为Δ=uα/2σ[]n(单侧检验中为μασm),则利用置信区间进行假设检验的决策准侧统一概括为: 若|X-μ0|≤Δ,不能拒绝H0;
若|X-μ0|>Δ,拒绝H0.
类似可考虑方差未知时的假设检验问题:若σ未知,用s进行估计,用t代替正态分布即可,见下表。
由上,对同一实例,当进行参数估计和假设检验,用的是同一样本,统计量和分布也相同时,可以利用置信区间进行假设检验。以几个例子作为进一步的说明。
2 若干应用
例1[1]有一种元件,对其平均使用寿命要求是应达1000小时,已知该种元件寿命服从正态分布,标准差为100小时,现从一批这样的元件中,随机抽取了49件,测得其平均寿命是950小时。试确定这批元件是否合格(α=0.05)。
解若使用寿命高于所要求的标准1000小时,自然认为元件为合格品,所以更关心置信下限值,因此,认为这是左单侧下限的检验问题。
H0∶μ≥1000H1∶μ<1000(左侧检验)
当α=0.05时,uα=1.645,置信区间的下限值:
μ0-uασn=1000-1.645×10049=976.5
进行决策示意图如下所示
由上图看出,若样本均值x->976.5,不能拒绝原假设,可以认为这批元件合格;若x-≤976.5,则拒绝原假设,认为这批元件不合格。经计算,本题中x-=950>976.5,故拒绝原假设,认为这批元件不合格。
置信区间中的允许误差Δ=uασn=1.645×10049=23.5,利用置信区间进行假设检验,|x--μ0|=|950-1000|=50,因为|x--μ0|>Δ,所以拒绝H0。
用置信区间进行检验时,好处是可以同时对几个统计量进行检验。例如,从三批这样的元件中分别抽取随机样本,测得使用寿命的均值分别为980,976,970,问这三批元件是否合格?
解由以上讨论,此问题十分简单,若x-i(i=1,2,3)>9765,则认为元件达到合格标准,否则便认为不合格。
例2[1]某种元件寿命记为X(小时),设X~N(μ,σ2),其中,μ,σ2未知,隨机抽取了16只元件,寿命测得如下:
280,264,149,170,101,159,224,168,379,212,179,222,485,362,250,260
问是否可以认为该元件的平均寿命大于225小时?(α=0.05)
解本题σ2未知,是关于μ右单侧上限检验问题。
H0∶μ≤225H1∶μ>225(右侧检验)
置信区间的上限值:μ0+ta(n-1)sn=225+1.7531×98.72616=268.2691
(α=0.05,t0.05(15)=1.7531)
由上图看出,若样本均值x-<268.2691,不能拒绝原假设,可以认为这批元件的平均寿命大于225小时,否则,拒绝原假设。本例中x-=241.5<268.2691,故不能拒绝原假设。
置信区间中的允许误差Δ=tα(n-1)sn=1.7531×98.72616=43.2691,利用置信区间进行假设检验,|x--μ0|=|241.5-225|=16.5,因|x--μ0|<Δ,无充足理由拒绝H0。
参考文献:
[1]贾俊平,何晓群,金勇进,等.统计学(第三版)[M].北京:中国人民大学出版社,2007.
[2]杨萍,敬斌.工程数学(下册)[M].西安:西安电子科技大学出版社,2016.
[3]茆诗松,程依明,濮晓龙.概率论与数理统计教程(第二版)[M].北京:高等教育出版社,2011.
[4]兰冲锋.统计学教学中关于假设检验问题探讨[J].湖南城市学院学报(自然科学版),2016,25(2)303304.
基金项目:陕西省教育厅专项科研计划资助项目(17JK1023)
作者简介:刘素兵(1980),女,河北邢台人,硕士,讲师,主要从事统计研究。