论文部分内容阅读
新课标高考卷一直把概率和统计的基础知识和方法作为必考内容,概率与统计综合类题目时常出现在高考题和模拟题中,而且这类题目背景新颖,求解灵活,是考查我們应用能力的好题.
考点一 古典概型与统计相结合
例1 某学校对学生的考试成绩作抽样调查,得到成绩的频率分布直方图如图所示,其中[70,80)对应的数值被污损,记为[x].
(1)求[x]的值.
(2)记[90,100]为[A]组,[80,90)为[B]组,[70,80)为[C]组,用分层抽样的方法从[90,100],[80,90),[70,80)三个分数段的学生中抽出6人参加比赛,从中任选3人为正选队员,求正选队员中有A组学生的概率.
[分数][O][频率
组距][0.02
0.01][40 50 60 70 80 90 100]
分析 (1)直接由频率和等于1列式计算[x]的值.
(2)利用分层抽样每层抽取的比例相等求出抽取的6人中三个分数段中所抽取的人数,然后利用列举法写出从6人中任抽3人的所有的抽法,查出3人中一定含有[A]组学生的抽法种数,最后利用古典概型概率计算公式求解.
解 (1)因为(0.01×3+0.02×2+x)×10=1,
所以x=0.03.
(2)设从[90,100]分数段的学生中抽出[m]人,
依题意得,[m+2m+3m=6],
所以[m=1].
所以从[80,90)中抽出的学生人数为2人,从[70,80)中抽出的学生人数为3人.
记从[90,100]中抽出的学生为[a],从[80,90)中抽出的学生为[b,c],从[70,80)中抽出的学生为[d,e,f],
从6人中抽出3人有:abc,abd,abe,abf,acd,ace,acf,ade,adf,aef,bcd,bce,bcf,bde,bdf,bef,cde,cdf,cef,def,共20种.
含有a的有:abc,abd,abe,abf,acd,ace,acf,ade,adf,aef,共10种.
所以正选队员中有[A]组学生的概率[P=1020=12].
点拨 有关古典概型与统计结合的题型无论是直接描述还是利用频率分布表、分布直方图、茎叶图等给出信息,只要能够从题干中提炼出需要的信息,则此类问题即可解决.
考点二 互斥事件、对立事件与统计相结合
例2 我国西部一个地区的年降水量(单位:mm)在下列区间上的概率如下表:
[年降水量\&[600,800)\&[800,1000)\&[1000,1200)\&[1200,1400)\&[1400,1600]\&概率\&0.12\&0.26\&0.38\&0.16\&0.08\&]
(1)求年降水量在[800,1200)上的概率;
(2)如果年降水量≥1200mm,就可能发生涝灾,求该地区可能发生涝灾的概率.
分析 (1)本题的关键是找到所求事件包含哪些互斥事件,年降水量在[800,1200)上由表中两个互斥事件构成,只需概率求和即可.
(2)本题的关键是找到所求事件包含哪些互斥事件,该地区可能发生涝灾由表中两个互斥事件构成,只需概率求和即可.
解 (1)设[A]={年降水量在[800,1200)上},事件[A]包含两个互斥事件:
[B]={年降水量在[800,1000)上},
[C]={年降水量在[1000,1200)上}.
所以[P(A)=P(B)+P(C)=0.26+0.38=0.64].
所以年降水量在[800,1200)上的概率为0.64.
(2)设[D]={年降水量≥1200mm},事件[D]包含两个互斥事件,[E]={年降水量在[1200,1400)上},[F]={年降水量在[1400,1600]上},
所以[P(D)=P(E)+P(F)=0.16+0.08=0.24].
所以该地区可能发生涝灾的概率为0.24.
点拨 (1)出现形式:通过频率分布表、频率分布直方图或茎叶图的形式给出概率的分布,求某范围内的概率.(2)解题策略:首先正确分析和理解频率分布表、频率分布直方图和茎叶图的意义,找到概率事件包含的互斥事件;其次,明确所含互斥事件是否是有一个发生,是否是互斥且对立的,然后确定计算的方法.
考点三 样本的数字特征与概率相结合
例3 在某次测验中,有6位同学的平均成绩为75分.用[xn]表示编号为[n(n=1,2,…,6)]的同学所得成绩,且前5位同学的成绩如下:
[编号[n]\&1\&2\&3\&4\&5\&成绩[xn]\&70\&76\&72\&70\&72\&]
(1)求第6位同学的成绩[x6]及这6位同学成绩的标准差[s].
(2)从前5位同学中,随机地选出2位同学,求恰有1位同学成绩在区间(68,75)上的概率.
分析 (1)由这6位同学的平均成绩为75分,建立关于[x6]的方程,可求得[x6],然后求方差,再求标准差.
(2)用列举法可得所求古典概型的概率.
解 (1)因为这6位同学的平均成绩为75分,
所以[16]×(70+76+72+70+72+[x6])=75,解得[x6]=90.
这6位同学成绩的方差
[s2=16]×[(70-75)2+(76-75)2+(72-75)2+(70-75)2+(72-75)2+(90-75)2]=49, 所以标准差[s=7].
(2)从前5位同学中,随机地选出2位同学的成绩有:(70,76),(70,72),(70,70),(70,72),(76,72),(76,70),(76,72),(72,70),(72,72),(70,72),共10种.
恰有1位同学成绩在区间(68,75)上的有:(70,76),(76,72),(76,70),(76,72),共4种.
所求的概率为[410=0.4].
即恰有1位同学成绩在区间(68,75)上的概率为0.4.
点拨 数字特征的意义:(1)众数体现了样本数据的最大集中点,但无法客观地反映总体特征.(2)中位数是样本数据所占频率的等分线.(3)标准差、方差描述了一组数据围绕平均数波动的大小. 标准差、方差越大,数据越分散;标准差、方差越小,数据越集中.
考点四 期望方差与正态分布、统计的综合
例4 从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
[质量指标值][频率
组距][0.033][0.024][0.022][0.009][0.008][0.002][165 175 185 195 205 215 225 235]
(1)求这500件产品质量指标值的样本平均数[x]和样本方差[s2](同一组数据用该区间的中点值作代表).
(2)由频率分布直方图可以认为,这种产品的质量指标值[Z]服从正态分布[N(μ,δ2)],其中[μ]近似为样本平均数[x],[δ2]近似为样本方差[s2].
①利用该正态分布,求[P(187.8 ②某用户从该企业购买了100件这种产品,记[X]表示这100件产品中质量指标值位于区间(187.8,212.2)的产品件数,利用①的结果,求[EX].
附:[150]≈12.2. 若[Z]~[N(μ,δ2)],则[P(μ-δ 分析 (1)运用离散型随机变量的期望和方差公式,即可求出.
(2)①由(1)知,[Z~N](200,150),从而求出[P](187.8<[Z]<212.2),注意运用所给数据;②由①知[X~B](100,0.6826),运用[EX=np]即可求得.
解 (1) 抽取产品质量指标值的样本平均数[x]和样本方差[s2]分别为
[x=170×0.02+180×0.09+190×0.22+200×0.33 ]
[+210×0.24+220×0.08+230×0.02][=200]
[s2=-302×0.02+-202×0.09+-102×0.22]
[+0×0.33 +102×0.24+202×0.08+302×0.02][=150]
(2)①由(1)知,[Z]~[N(200,150)],
从而[P(187.8 ②由①知,一件产品中质量指标值位于区间(187.8,212.2)的概率为0.6826.
依题意知[X?B(100,0.6826)],
所以[EX=100×0.6826=68.26].
点拨 本题主要考查离散型随机变量的期望和方差,以及正态分布的特点及概率求解.
考点五 独立性检验与概率相结合
例5 为了调查我市在校中学生参加体育运动的情况, 从中随机抽取了16名男同学和14名女同学,调查发现,男、女同学中分别有12人和6人喜爱运动,其余不喜爱.
(1)根据以上数据完成以下2×2列联表:
[ \&喜爱运动\&不喜爱运动\&总计\&男\&\& \&16\&女\&\& \&14\&总计\& \& \&30\&]
(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.010的前提下认为性别与喜爱运动有关?
(3)将以上统计结果中的频率视作概率, 从我市中学生中随机抽取3人,若其中喜爱运动的人数为[ξ],求[ξ]的分布列和均值.
參考数据:
[[P(K2≥k0)]\&0.40\&0.25\&0.10\&0.010\&[k0]\&0.708\&1.323\&2.706\&6.635\&]
分析 (1)本题是一个简单的数字的运算,根据a,b,c,d的已知和未知的结果,填写空格.
(2)假设是否喜爱运动与性别无关,由已知数据可求得观测值,把求得的观测值同临界值进行比较,得到在犯错的概率不超过0.10的前提下不能判断喜爱运动与性别有关.
(3)喜爱运动的人数为[ξ,ξ]的取值分别为0,1,2,3,结合变量对应的事件,利用等可能事件的概率公式求出概率,写出分布列和期望.
解 (1)
[ \&喜爱运动\&不喜爱运动\&总计\&男\&12\&4\&16\&女\&6\&8\&14\&总计\&18\&12\&30\&]
(2)假设:是否喜爱运动与性别无关,由已知数据可求得,
[K2=30×(12×8-6×4)2(12+4)(6+8)(12+6)(4+8)≈3.2143<6.635].
因此,在犯错的概率不超过0.10的前提下不能判断喜爱运动与性别有关.
(3)统计结果中喜爱运动的中学生所占的频率为[35].
喜爱运动的人数为[ξ]的取值分别为:0,1,2, 3, 则有,
[P(ξ=0)=C03350253=8125],
[P(ξ=1)=C1335?252=36125],
[P(ξ=2)=C2325?352=54125],
[P(ξ=3)=C33353=27125].
喜爱运动的人数为[ξ]的分布列为:
[[ξ]\&0\&1\&2\&3\&[P]\&[8125]\&[36125]\&[54125]\&[27125]\&]
因为[ξ]~[B(3,35)],
所以喜爱运动的人数[ξ]的值为[Eξ=3×35=95].
点拨 本题考查独立性检验的列联表、假设性判断、离散型随机变量的分布列和期望.
考点一 古典概型与统计相结合
例1 某学校对学生的考试成绩作抽样调查,得到成绩的频率分布直方图如图所示,其中[70,80)对应的数值被污损,记为[x].
(1)求[x]的值.
(2)记[90,100]为[A]组,[80,90)为[B]组,[70,80)为[C]组,用分层抽样的方法从[90,100],[80,90),[70,80)三个分数段的学生中抽出6人参加比赛,从中任选3人为正选队员,求正选队员中有A组学生的概率.
[分数][O][频率
组距][0.02
0.01][40 50 60 70 80 90 100]
分析 (1)直接由频率和等于1列式计算[x]的值.
(2)利用分层抽样每层抽取的比例相等求出抽取的6人中三个分数段中所抽取的人数,然后利用列举法写出从6人中任抽3人的所有的抽法,查出3人中一定含有[A]组学生的抽法种数,最后利用古典概型概率计算公式求解.
解 (1)因为(0.01×3+0.02×2+x)×10=1,
所以x=0.03.
(2)设从[90,100]分数段的学生中抽出[m]人,
依题意得,[m+2m+3m=6],
所以[m=1].
所以从[80,90)中抽出的学生人数为2人,从[70,80)中抽出的学生人数为3人.
记从[90,100]中抽出的学生为[a],从[80,90)中抽出的学生为[b,c],从[70,80)中抽出的学生为[d,e,f],
从6人中抽出3人有:abc,abd,abe,abf,acd,ace,acf,ade,adf,aef,bcd,bce,bcf,bde,bdf,bef,cde,cdf,cef,def,共20种.
含有a的有:abc,abd,abe,abf,acd,ace,acf,ade,adf,aef,共10种.
所以正选队员中有[A]组学生的概率[P=1020=12].
点拨 有关古典概型与统计结合的题型无论是直接描述还是利用频率分布表、分布直方图、茎叶图等给出信息,只要能够从题干中提炼出需要的信息,则此类问题即可解决.
考点二 互斥事件、对立事件与统计相结合
例2 我国西部一个地区的年降水量(单位:mm)在下列区间上的概率如下表:
[年降水量\&[600,800)\&[800,1000)\&[1000,1200)\&[1200,1400)\&[1400,1600]\&概率\&0.12\&0.26\&0.38\&0.16\&0.08\&]
(1)求年降水量在[800,1200)上的概率;
(2)如果年降水量≥1200mm,就可能发生涝灾,求该地区可能发生涝灾的概率.
分析 (1)本题的关键是找到所求事件包含哪些互斥事件,年降水量在[800,1200)上由表中两个互斥事件构成,只需概率求和即可.
(2)本题的关键是找到所求事件包含哪些互斥事件,该地区可能发生涝灾由表中两个互斥事件构成,只需概率求和即可.
解 (1)设[A]={年降水量在[800,1200)上},事件[A]包含两个互斥事件:
[B]={年降水量在[800,1000)上},
[C]={年降水量在[1000,1200)上}.
所以[P(A)=P(B)+P(C)=0.26+0.38=0.64].
所以年降水量在[800,1200)上的概率为0.64.
(2)设[D]={年降水量≥1200mm},事件[D]包含两个互斥事件,[E]={年降水量在[1200,1400)上},[F]={年降水量在[1400,1600]上},
所以[P(D)=P(E)+P(F)=0.16+0.08=0.24].
所以该地区可能发生涝灾的概率为0.24.
点拨 (1)出现形式:通过频率分布表、频率分布直方图或茎叶图的形式给出概率的分布,求某范围内的概率.(2)解题策略:首先正确分析和理解频率分布表、频率分布直方图和茎叶图的意义,找到概率事件包含的互斥事件;其次,明确所含互斥事件是否是有一个发生,是否是互斥且对立的,然后确定计算的方法.
考点三 样本的数字特征与概率相结合
例3 在某次测验中,有6位同学的平均成绩为75分.用[xn]表示编号为[n(n=1,2,…,6)]的同学所得成绩,且前5位同学的成绩如下:
[编号[n]\&1\&2\&3\&4\&5\&成绩[xn]\&70\&76\&72\&70\&72\&]
(1)求第6位同学的成绩[x6]及这6位同学成绩的标准差[s].
(2)从前5位同学中,随机地选出2位同学,求恰有1位同学成绩在区间(68,75)上的概率.
分析 (1)由这6位同学的平均成绩为75分,建立关于[x6]的方程,可求得[x6],然后求方差,再求标准差.
(2)用列举法可得所求古典概型的概率.
解 (1)因为这6位同学的平均成绩为75分,
所以[16]×(70+76+72+70+72+[x6])=75,解得[x6]=90.
这6位同学成绩的方差
[s2=16]×[(70-75)2+(76-75)2+(72-75)2+(70-75)2+(72-75)2+(90-75)2]=49, 所以标准差[s=7].
(2)从前5位同学中,随机地选出2位同学的成绩有:(70,76),(70,72),(70,70),(70,72),(76,72),(76,70),(76,72),(72,70),(72,72),(70,72),共10种.
恰有1位同学成绩在区间(68,75)上的有:(70,76),(76,72),(76,70),(76,72),共4种.
所求的概率为[410=0.4].
即恰有1位同学成绩在区间(68,75)上的概率为0.4.
点拨 数字特征的意义:(1)众数体现了样本数据的最大集中点,但无法客观地反映总体特征.(2)中位数是样本数据所占频率的等分线.(3)标准差、方差描述了一组数据围绕平均数波动的大小. 标准差、方差越大,数据越分散;标准差、方差越小,数据越集中.
考点四 期望方差与正态分布、统计的综合
例4 从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
[质量指标值][频率
组距][0.033][0.024][0.022][0.009][0.008][0.002][165 175 185 195 205 215 225 235]
(1)求这500件产品质量指标值的样本平均数[x]和样本方差[s2](同一组数据用该区间的中点值作代表).
(2)由频率分布直方图可以认为,这种产品的质量指标值[Z]服从正态分布[N(μ,δ2)],其中[μ]近似为样本平均数[x],[δ2]近似为样本方差[s2].
①利用该正态分布,求[P(187.8
附:[150]≈12.2. 若[Z]~[N(μ,δ2)],则[P(μ-δ
(2)①由(1)知,[Z~N](200,150),从而求出[P](187.8<[Z]<212.2),注意运用所给数据;②由①知[X~B](100,0.6826),运用[EX=np]即可求得.
解 (1) 抽取产品质量指标值的样本平均数[x]和样本方差[s2]分别为
[x=170×0.02+180×0.09+190×0.22+200×0.33 ]
[+210×0.24+220×0.08+230×0.02][=200]
[s2=-302×0.02+-202×0.09+-102×0.22]
[+0×0.33 +102×0.24+202×0.08+302×0.02][=150]
(2)①由(1)知,[Z]~[N(200,150)],
从而[P(187.8
依题意知[X?B(100,0.6826)],
所以[EX=100×0.6826=68.26].
点拨 本题主要考查离散型随机变量的期望和方差,以及正态分布的特点及概率求解.
考点五 独立性检验与概率相结合
例5 为了调查我市在校中学生参加体育运动的情况, 从中随机抽取了16名男同学和14名女同学,调查发现,男、女同学中分别有12人和6人喜爱运动,其余不喜爱.
(1)根据以上数据完成以下2×2列联表:
[ \&喜爱运动\&不喜爱运动\&总计\&男\&\& \&16\&女\&\& \&14\&总计\& \& \&30\&]
(2)根据列联表的独立性检验,能否在犯错误的概率不超过0.010的前提下认为性别与喜爱运动有关?
(3)将以上统计结果中的频率视作概率, 从我市中学生中随机抽取3人,若其中喜爱运动的人数为[ξ],求[ξ]的分布列和均值.
參考数据:
[[P(K2≥k0)]\&0.40\&0.25\&0.10\&0.010\&[k0]\&0.708\&1.323\&2.706\&6.635\&]
分析 (1)本题是一个简单的数字的运算,根据a,b,c,d的已知和未知的结果,填写空格.
(2)假设是否喜爱运动与性别无关,由已知数据可求得观测值,把求得的观测值同临界值进行比较,得到在犯错的概率不超过0.10的前提下不能判断喜爱运动与性别有关.
(3)喜爱运动的人数为[ξ,ξ]的取值分别为0,1,2,3,结合变量对应的事件,利用等可能事件的概率公式求出概率,写出分布列和期望.
解 (1)
[ \&喜爱运动\&不喜爱运动\&总计\&男\&12\&4\&16\&女\&6\&8\&14\&总计\&18\&12\&30\&]
(2)假设:是否喜爱运动与性别无关,由已知数据可求得,
[K2=30×(12×8-6×4)2(12+4)(6+8)(12+6)(4+8)≈3.2143<6.635].
因此,在犯错的概率不超过0.10的前提下不能判断喜爱运动与性别有关.
(3)统计结果中喜爱运动的中学生所占的频率为[35].
喜爱运动的人数为[ξ]的取值分别为:0,1,2, 3, 则有,
[P(ξ=0)=C03350253=8125],
[P(ξ=1)=C1335?252=36125],
[P(ξ=2)=C2325?352=54125],
[P(ξ=3)=C33353=27125].
喜爱运动的人数为[ξ]的分布列为:
[[ξ]\&0\&1\&2\&3\&[P]\&[8125]\&[36125]\&[54125]\&[27125]\&]
因为[ξ]~[B(3,35)],
所以喜爱运动的人数[ξ]的值为[Eξ=3×35=95].
点拨 本题考查独立性检验的列联表、假设性判断、离散型随机变量的分布列和期望.