论文部分内容阅读
正态分布是统计中很常见也很常用的一种分布,它能刻画很多随机现象.如果一个随机变量是众多的、互不相干的、不分主次的偶然因素作用的结果之和,它就服从或近似地服从正态分布.服从正态分布的随机变量是连续型随机变量,它与离散型随机变量的概率用分布列描述不同,其概率分布规律用分布密度函数(曲线)来描述.
要点一 正态分布的概念
如果对于任意实数[a,b(a 例1 一台机床生产一种零件,现从中抽取10件,它们的尺寸如下(单位:mm):10.2,10.1,10,9.8,9.9,10.3,9.7,10,9.9,10.1.如果机床生产的零件的尺寸服从正态分布,求该正态分布的概率密度函数.
解析 要求正态分布的概率密度函数表达式,只要求出参数[μ],[σ]即可,而[μ],[σ]分别为用样本的均值和标准差估计出的总体的均值和标准差.依题意,得[μ=10],[σ=0.03].所以[X]的密度函数为[ϕ(x)=106πe-50(x-10)23].
要点二 正态曲线与密度函数
1.正态曲线的形成过程.
高尔顿板试验中,投放一个小球就相当于做了一次随机试验,其结果就是小球落在某一个小槽内. 重复投放n个小球相当于做了[n]次独立重复试验,某一小槽中小球的个数就是小球落入该槽中的频数,这个频数和槽中的小球堆积高度成正比,因此,各个槽中小球的堆积高度就反映了小球落入各个槽内的频数. 实际上每一个小槽的宽度都一样,相当于组距,所以小槽的高度与“频数/组距”也成正比,也就是说我们得到了小球分布规律的频率分布直方图,进而可作出频率分布折线图. 当试验次数不断增大,组距无限缩小时(小球越来越小,小槽越来越窄),这条折线就会无限接近于一条光滑曲线,此即正态曲线.
需要注意的是,正态曲线的函数表达式[ϕμ,σ(x)=12πσe-(x-μ)22σ2],[x∈(-∞,+∞)]中, [x]表示实数,如身高,其单位是cm,[y]轴表示频率/组距,单位是cm-1.
2.正态密度函数和概率分布之间的关系
[P(a 3.正态曲线的特点
(1)非负性:曲线在x轴的上方,与[x]轴不相交([x]轴是曲线的渐近线).
(2)对称性:函数是单峰函数,曲线关于直线[x=μ]对称,曲线呈“钟形”.
(3)确定性:曲线与[x]轴之间的面积为1.
(4)单调性:在直线[x=μ]的左边, 曲线是单调上升的;在直线[x=μ]的右边, 曲线是单调下降的;在[x=μ]处,函数[ϕμ,σ(x)]取得最大值[12πσ].
(5)几何性:当[σ]一定时,曲线的位置由[μ]确定,曲线随[μ]的增大(减小)而向右(向左)平移;当[μ]一定时,曲线的形状由[σ]确定,[σ]越大,曲线越“矮胖”,表示总体的分布相对于[μ]越分散,反之,曲线越“瘦高”,表示总体的分布相对于[μ]越集中.
4.特殊区间的概率
若[X~N(μ,σ2)],则有
[Pμ-σ [Pμ-2σ [Pμ-3σ [Px≤μ=px>μ=0.5].
例2 某市组织一次高三调研考试,考试后统计的数学成绩服从正态分布,其密度函数为[f(x)=12π⋅10e-(x-80)2200,x∈(-∞,+∞)],则下列命题不正确的是( )
A.该市这次考试的数学平均成绩为80分
B.分数在120分以上的人数与分数在60分以下的人数相同
C.分数在110分以上的人数与分数在50分以下的人数相同
D.该市这次考试的数学成绩标准差为10
解析 这里[μ]=80,[σ]=10,110与50关于[μ]=80对称,所以A、C、D正确,故选B.
例3 设随机变量[ξ]服从正态分布[N(0,1)],已知[P(ξ<-1.96)=0.025],则[P(|ξ|<1.96)]=( )
A.0.025 B.0.050
C.0.950 D.0.975
解析 正态分布[N(0,1)]关于[μ=0]对称,所以[P(ξ>1.96)=P(ξ<-1.96)=0.025],[P(|ξ|<1.96)]=1-0.025
-0.025=0.950. 故选C.
例4 设随机变量[ξ∼N(2,9)],若[P(ξ>c+1)=] [P(ξ<c-[1])],则c的值为( )
A. 1 B. 2 C. 3 D. 4
解析 由正态分布的对称性,可知[c+1]与[c-1]关于[x=μ=2]对称,所以[c+1+c-1=4],故[c=2],选择B.
例5 设两个正态分布[N(μ1,σ21)(σ1>0)]和[N(μ2,][σ22)(σ2>0)]的密度函数图象如下图所示,则有( )
[-1.0][-0.5][0.5][1.0] [0.2][0.4][0.6][0.8][1.0][1.2][1.4]
A.[μ1<μ2,σ1<σ2] B.[μ1<μ2,σ1>σ2]
C.[μ1>μ2,σ1<σ2] D.[μ1>μ2,σ1>σ2]
解析 与正态分布[N(μ2,σ22)(σ2>0)]相比,[N(μ1,σ21)][(σ1>0)]的图象比较“瘦高”,故概率分布更加集中在其平均值附近,并且平均值较小,故选A.
要点三 正态分布的实际应用
利用服从正态分布的随机变量在三个特殊区间上的分布规律可以解决许多实际问题,比如在某一特定区间上的概率(数量)分布、决策选定、产品检验等.
例6 在某次数学考试中,考生的成绩[X]服从正态分布,即[X∼N(90,100)].
(1)求考试成绩[X]位于区间(70,110]上的概率是多少.
(2)若此次考试共有2000名考生,试估计考试成绩在(80,100]间的考生大约有多少人.
解析 (1)依题意,[X∼N(90,100)],
所以[μ=90,σ=10,]
[∴P(70 [=P(90-2×10 (2)[P(80 例7 某出租车从学校到汽车站有两条路线可走,第一条路线的路程较短,但交通拥挤,所需时间(单位:min)服从正态分布[N(50,100)],第二条路线路程较长,但交通阻塞少,所需时间(单位:min)服从正态分布[N(70,52)]. 若有80分钟可用,应走哪条路?
解析 设[X]为行车时间,如有80分钟可用,则走第一条路线及时赶到车站的概率为
[P(x≤80)=P(x≤50+3×10)]
[=P(x≤50)+P(50 [=0.5+12×0.9974=0.9987;]
走第二条路线及时赶到车站的概率为
[P(x≤80)=P(x≤70+2×5)]
[=P(x≤70)+P(70 [=0.5+12×0.9544][=0.9772<0.9987.]
因此应走第一条路线.
例8 已知某厂生产的零件外直径[X∼N](10,0.22),从该厂某天上午、下午生产的零件中各随机取出一个,测得尺寸为9.52和9.98,试分析该厂这一天的生产状况是否正常.
解析 工业常用[3σ]原则来判定工厂是否正常工作,即产品数据应在[(μ-3σ,μ+3σ)]内,这里产品尺寸应在(10-0.6,10+0.6)即(9.4,10.6)内才算正常,9.52和9.98正好满足,所以这一天的生产状况是正常的.
要点四 正态分布的推广应用
正态分布是一种特殊的连续型分布,对正态分布的处理方法也可推广到一般的连续型随机变量问题上.
例9 已知连续性随机变量[x]的概率密度函数为[f(x)=0, x<1,0.5x-a,1≤x<3,0, x≥3.]
(1)求常数[a]的值;
(2)画出[x]的概率密度曲线;
(3)求出[P(1≤x≤2)];
(4)求出[x]的分布函数[F(t)=P(x≤t)]的解析式.
解析 (1)类比正态分布,由连续型随机变量密度函数的性质可知,密度曲线和[x]轴之间的面积为1,故有[12×(3-1)[(12-a)+(32-a)]=1],解得[a=0.5.]
(2)由[a=0.5,]得
[f(x)=0,x<1,0.5x-0.5,1≤x<3,0, x≥3.]
其图象为
(3)[P(1≤x≤2)]
[=12×(2-1)×[(12×1-12)+(12×2-12)]=14].
(4)[F(t)=0, t<1,14(t-1)2,1≤t<3,1, t≥3.]
【练习】
1.设随机变量[ξ~N(μ , σ2), ]且[P(ξ≤c)=][P(ξ>c), ]则[c]等于( )
A. 0 B. [σ] C. [-μ] D. [μ]
2.设[ξ]的概率密度函数为[f(x)=12πe-(x-1)22],则下列结论错误的是( )
A. [P(ξ<1)=P(ξ>1)]
B. [P(-1≤ξ≤1)=P(-1<ξ<1)]
C. [f(x)]的渐近线是[x=0]
D. [η=ξ-1~N(0,1)]
3.在某项测量中,测量结果[ξ]服从正态分布[N(1,σ2)(σ>0)].若[ξ]在[(0,1)]内取值的概率为0.4,则[ξ]在[(0,2)]内取值的概率为 .
4.某物体的温度[T][(°F)]是一个随机变量,已知[T~N(98.6,2)],又随机变量[S](℃)满足[S=59(T-32)],求[S]的概率密度函数.
5.设在一次数学考试中,某班学生的分数[X~][N](110,202),且知满分150分,这个班的学生共54人.求这个班在这次数学考试中及格(不小于90分)的人数和130分以上的人数.
【参考答案】
1.D
2.C
3.0.8
4.[E(S)=59[E(T)-32]=59(98.6-32)=37],
[D(S)=592][×D(T)=2581×2=5081].
所以随机变量[S]的概率密度为
[f(y)=910πe-81100(y-37)2,(-∞ 5.及格45人,130分以上9人.
要点一 正态分布的概念
如果对于任意实数[a,b(a 例1 一台机床生产一种零件,现从中抽取10件,它们的尺寸如下(单位:mm):10.2,10.1,10,9.8,9.9,10.3,9.7,10,9.9,10.1.如果机床生产的零件的尺寸服从正态分布,求该正态分布的概率密度函数.
解析 要求正态分布的概率密度函数表达式,只要求出参数[μ],[σ]即可,而[μ],[σ]分别为用样本的均值和标准差估计出的总体的均值和标准差.依题意,得[μ=10],[σ=0.03].所以[X]的密度函数为[ϕ(x)=106πe-50(x-10)23].
要点二 正态曲线与密度函数
1.正态曲线的形成过程.
高尔顿板试验中,投放一个小球就相当于做了一次随机试验,其结果就是小球落在某一个小槽内. 重复投放n个小球相当于做了[n]次独立重复试验,某一小槽中小球的个数就是小球落入该槽中的频数,这个频数和槽中的小球堆积高度成正比,因此,各个槽中小球的堆积高度就反映了小球落入各个槽内的频数. 实际上每一个小槽的宽度都一样,相当于组距,所以小槽的高度与“频数/组距”也成正比,也就是说我们得到了小球分布规律的频率分布直方图,进而可作出频率分布折线图. 当试验次数不断增大,组距无限缩小时(小球越来越小,小槽越来越窄),这条折线就会无限接近于一条光滑曲线,此即正态曲线.
需要注意的是,正态曲线的函数表达式[ϕμ,σ(x)=12πσe-(x-μ)22σ2],[x∈(-∞,+∞)]中, [x]表示实数,如身高,其单位是cm,[y]轴表示频率/组距,单位是cm-1.
2.正态密度函数和概率分布之间的关系
[P(a
(1)非负性:曲线在x轴的上方,与[x]轴不相交([x]轴是曲线的渐近线).
(2)对称性:函数是单峰函数,曲线关于直线[x=μ]对称,曲线呈“钟形”.
(3)确定性:曲线与[x]轴之间的面积为1.
(4)单调性:在直线[x=μ]的左边, 曲线是单调上升的;在直线[x=μ]的右边, 曲线是单调下降的;在[x=μ]处,函数[ϕμ,σ(x)]取得最大值[12πσ].
(5)几何性:当[σ]一定时,曲线的位置由[μ]确定,曲线随[μ]的增大(减小)而向右(向左)平移;当[μ]一定时,曲线的形状由[σ]确定,[σ]越大,曲线越“矮胖”,表示总体的分布相对于[μ]越分散,反之,曲线越“瘦高”,表示总体的分布相对于[μ]越集中.
4.特殊区间的概率
若[X~N(μ,σ2)],则有
[Pμ-σ
例2 某市组织一次高三调研考试,考试后统计的数学成绩服从正态分布,其密度函数为[f(x)=12π⋅10e-(x-80)2200,x∈(-∞,+∞)],则下列命题不正确的是( )
A.该市这次考试的数学平均成绩为80分
B.分数在120分以上的人数与分数在60分以下的人数相同
C.分数在110分以上的人数与分数在50分以下的人数相同
D.该市这次考试的数学成绩标准差为10
解析 这里[μ]=80,[σ]=10,110与50关于[μ]=80对称,所以A、C、D正确,故选B.
例3 设随机变量[ξ]服从正态分布[N(0,1)],已知[P(ξ<-1.96)=0.025],则[P(|ξ|<1.96)]=( )
A.0.025 B.0.050
C.0.950 D.0.975
解析 正态分布[N(0,1)]关于[μ=0]对称,所以[P(ξ>1.96)=P(ξ<-1.96)=0.025],[P(|ξ|<1.96)]=1-0.025
-0.025=0.950. 故选C.
例4 设随机变量[ξ∼N(2,9)],若[P(ξ>c+1)=] [P(ξ<c-[1])],则c的值为( )
A. 1 B. 2 C. 3 D. 4
解析 由正态分布的对称性,可知[c+1]与[c-1]关于[x=μ=2]对称,所以[c+1+c-1=4],故[c=2],选择B.
例5 设两个正态分布[N(μ1,σ21)(σ1>0)]和[N(μ2,][σ22)(σ2>0)]的密度函数图象如下图所示,则有( )
[-1.0][-0.5][0.5][1.0] [0.2][0.4][0.6][0.8][1.0][1.2][1.4]
A.[μ1<μ2,σ1<σ2] B.[μ1<μ2,σ1>σ2]
C.[μ1>μ2,σ1<σ2] D.[μ1>μ2,σ1>σ2]
解析 与正态分布[N(μ2,σ22)(σ2>0)]相比,[N(μ1,σ21)][(σ1>0)]的图象比较“瘦高”,故概率分布更加集中在其平均值附近,并且平均值较小,故选A.
要点三 正态分布的实际应用
利用服从正态分布的随机变量在三个特殊区间上的分布规律可以解决许多实际问题,比如在某一特定区间上的概率(数量)分布、决策选定、产品检验等.
例6 在某次数学考试中,考生的成绩[X]服从正态分布,即[X∼N(90,100)].
(1)求考试成绩[X]位于区间(70,110]上的概率是多少.
(2)若此次考试共有2000名考生,试估计考试成绩在(80,100]间的考生大约有多少人.
解析 (1)依题意,[X∼N(90,100)],
所以[μ=90,σ=10,]
[∴P(70
解析 设[X]为行车时间,如有80分钟可用,则走第一条路线及时赶到车站的概率为
[P(x≤80)=P(x≤50+3×10)]
[=P(x≤50)+P(50
走第二条路线及时赶到车站的概率为
[P(x≤80)=P(x≤70+2×5)]
[=P(x≤70)+P(70
因此应走第一条路线.
例8 已知某厂生产的零件外直径[X∼N](10,0.22),从该厂某天上午、下午生产的零件中各随机取出一个,测得尺寸为9.52和9.98,试分析该厂这一天的生产状况是否正常.
解析 工业常用[3σ]原则来判定工厂是否正常工作,即产品数据应在[(μ-3σ,μ+3σ)]内,这里产品尺寸应在(10-0.6,10+0.6)即(9.4,10.6)内才算正常,9.52和9.98正好满足,所以这一天的生产状况是正常的.
要点四 正态分布的推广应用
正态分布是一种特殊的连续型分布,对正态分布的处理方法也可推广到一般的连续型随机变量问题上.
例9 已知连续性随机变量[x]的概率密度函数为[f(x)=0, x<1,0.5x-a,1≤x<3,0, x≥3.]
(1)求常数[a]的值;
(2)画出[x]的概率密度曲线;
(3)求出[P(1≤x≤2)];
(4)求出[x]的分布函数[F(t)=P(x≤t)]的解析式.
解析 (1)类比正态分布,由连续型随机变量密度函数的性质可知,密度曲线和[x]轴之间的面积为1,故有[12×(3-1)[(12-a)+(32-a)]=1],解得[a=0.5.]
(2)由[a=0.5,]得
[f(x)=0,x<1,0.5x-0.5,1≤x<3,0, x≥3.]
其图象为
(3)[P(1≤x≤2)]
[=12×(2-1)×[(12×1-12)+(12×2-12)]=14].
(4)[F(t)=0, t<1,14(t-1)2,1≤t<3,1, t≥3.]
【练习】
1.设随机变量[ξ~N(μ , σ2), ]且[P(ξ≤c)=][P(ξ>c), ]则[c]等于( )
A. 0 B. [σ] C. [-μ] D. [μ]
2.设[ξ]的概率密度函数为[f(x)=12πe-(x-1)22],则下列结论错误的是( )
A. [P(ξ<1)=P(ξ>1)]
B. [P(-1≤ξ≤1)=P(-1<ξ<1)]
C. [f(x)]的渐近线是[x=0]
D. [η=ξ-1~N(0,1)]
3.在某项测量中,测量结果[ξ]服从正态分布[N(1,σ2)(σ>0)].若[ξ]在[(0,1)]内取值的概率为0.4,则[ξ]在[(0,2)]内取值的概率为 .
4.某物体的温度[T][(°F)]是一个随机变量,已知[T~N(98.6,2)],又随机变量[S](℃)满足[S=59(T-32)],求[S]的概率密度函数.
5.设在一次数学考试中,某班学生的分数[X~][N](110,202),且知满分150分,这个班的学生共54人.求这个班在这次数学考试中及格(不小于90分)的人数和130分以上的人数.
【参考答案】
1.D
2.C
3.0.8
4.[E(S)=59[E(T)-32]=59(98.6-32)=37],
[D(S)=592][×D(T)=2581×2=5081].
所以随机变量[S]的概率密度为
[f(y)=910πe-81100(y-37)2,(-∞