论文部分内容阅读
变量在数学和生活中随处可见,我们把变量分为定量变量和分类变量.定量变量,如体重、身高、温度、考试成绩等;分类变量,如性别、是否吸烟、是否得某种疾病、宗教信仰等. 本文探究的是两个分类变量间的独立性检验问题.运用独立性检验的基本思想,可以考查两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度.
一、联表法与等高条形图的应用
通过三维柱形图,可以直观、粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度,还需要运用独立性检验的方法来判断.作出列联表,并构造(其中[n=a+b+c+d]为样本容量),用它的大小可以决定是否拒绝原来的统计假设[H0], 如果算出的[K2]值较大,就拒绝[H0],也就是拒绝“事件[A]与[B]无关”,从而就认为它们是有关系的.
例1 研究人员选取170名青年男女大学生,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的22名,作否定的38名;男生110名在相同的项目上作肯定的有22名,作否定的有88名.问:性别与态度之间是否存在某种关系?分别用图形和独立性检验的方法判断.
比较来说,底面副对角线上两个柱体高度的乘积要大一些,因此可以在某种程度上认为“性别与态度有关”.
(2)根据题目所给数据建立如下列联表:
根据列联表中的数据得到,
所以有97.5%的把握认为“性别与态度有关”.
二、独立性检验的应用
1. 通过观察值[k]与临界值[k0]的比较来判断
独立性检验的基本思想类似反证法:(1)假设结论不成立, 即“两个分类变量没有关系”;(2)在此假设下随机变量[K2]应该很小,如果由观测数据计算得到[K2]的观测值[k]很大,则在一定程度上说明假设不合理;(3)根据随机变量[K2]的含义,可以通过评价该假设不合理的程度.
例2 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)上的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:
(1)试分别估计两个分厂生产的零件的优质品率;
(2)由以上统计数据填下面2×2列联表,并分析是否有99%的把握认为“两个分厂生产的零件的质量有差异”.
解析 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为[360500]=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为(2)2×2列联表如下:
所以有99%的把握认为“两个分厂生产的零件的质量有差异”.
2. 通过定义来判断
例3 在一次恶劣气候的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判断是否在恶劣气候飞行中,“性别与晕机有关系”错判成没有关系的概率不超过[0.1].
解析 根据题意,列联表如下.
提出统计假设,[H0]:在恶劣气候飞行中男人与女人一样容易晕机,则.
故我们有90%的把握认为在这次航程中男人比女人更容易晕机.
所以“性别与晕机有关系”错判成没有关系的概率不超过[0.1].
一、联表法与等高条形图的应用
通过三维柱形图,可以直观、粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度,还需要运用独立性检验的方法来判断.作出列联表,并构造(其中[n=a+b+c+d]为样本容量),用它的大小可以决定是否拒绝原来的统计假设[H0], 如果算出的[K2]值较大,就拒绝[H0],也就是拒绝“事件[A]与[B]无关”,从而就认为它们是有关系的.
例1 研究人员选取170名青年男女大学生,对他们进行一种心理测验.发现有60名女生对该心理测验中的最后一个题目的反应是:作肯定的22名,作否定的38名;男生110名在相同的项目上作肯定的有22名,作否定的有88名.问:性别与态度之间是否存在某种关系?分别用图形和独立性检验的方法判断.
比较来说,底面副对角线上两个柱体高度的乘积要大一些,因此可以在某种程度上认为“性别与态度有关”.
(2)根据题目所给数据建立如下列联表:
根据列联表中的数据得到,
所以有97.5%的把握认为“性别与态度有关”.
二、独立性检验的应用
1. 通过观察值[k]与临界值[k0]的比较来判断
独立性检验的基本思想类似反证法:(1)假设结论不成立, 即“两个分类变量没有关系”;(2)在此假设下随机变量[K2]应该很小,如果由观测数据计算得到[K2]的观测值[k]很大,则在一定程度上说明假设不合理;(3)根据随机变量[K2]的含义,可以通过评价该假设不合理的程度.
例2 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)上的零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:
(1)试分别估计两个分厂生产的零件的优质品率;
(2)由以上统计数据填下面2×2列联表,并分析是否有99%的把握认为“两个分厂生产的零件的质量有差异”.
解析 (1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为[360500]=72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为(2)2×2列联表如下:
所以有99%的把握认为“两个分厂生产的零件的质量有差异”.
2. 通过定义来判断
例3 在一次恶劣气候的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人.请你根据所给数据判断是否在恶劣气候飞行中,“性别与晕机有关系”错判成没有关系的概率不超过[0.1].
解析 根据题意,列联表如下.
提出统计假设,[H0]:在恶劣气候飞行中男人与女人一样容易晕机,则.
故我们有90%的把握认为在这次航程中男人比女人更容易晕机.
所以“性别与晕机有关系”错判成没有关系的概率不超过[0.1].