二项分布事件概率的两种近似计算方法

来源 :现代职业教育·高职高专 | 被引量 : 0次 | 上传用户:yang2shuo7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要] 二项分布是一个非常重要的随机变量模型,很多随机现象都可以用二项分布模型来描述,但有关二项分布事件概率的计算却很麻烦。根据泊松定理和中心极限定理给出了二项分布事件概率的两种近似计算方法,具体例子表明两种方法简便有效。
  [关 键 词] 二项分布;事件概率;泊松分布;正态分布;随机现象
  [中图分类号] G642 [文献标志码] A [文章编号] 2096-0603(2018)01-0182-01
  一、问题提出
  二项分布是一个非常重要的分布,很多随机现象都可以用二项分布来描述,尤其是一些对人类生活、社会发展有着重大影响的随机现象都需要用二项分布来描述,比如,实验的成功与失败、种子发芽与不发芽、生男与生女、考试及格与不及格、产品合格与不合格、买彩票中奖与不中奖等。事实上,只要某种随机现象对应的随机试验是伯努利(Bernoulli)概型[注],则该随机现象就可用二项分布来描述。但有关二项分布事件概率的计算却很麻烦,需要借助简便有效的计算方法。本文在深入研究泊松定理和中心极限定理的基础上,给出了二项分布事件概率的两种近似计算方法,具体例子表明这两种方法简便有效。为了表述方便,下面首先给出二项分布的定义及其数学表示形式。
  二项分布:如果随机变量的可能取值为0,1,2,L,n,且取每个可能值的概率为
  PX=k=Cknpk(1-p)n-k,k=0,1,2,L,n,
  则称随机变量服从以n,p为参数的二项分布,记作X∶B(n,p),这里Ckn表示从n个不同元素中取出个元素的组合数,即为Ckn=■,0  现就具体问题“设某保险公司的某人寿保险险种有1000人投保,每个人在一年内死亡的概率为0.005,且每个人在一年内是否死亡是相互独立的,求在未来一年中这1000个投保人中死亡人数不超过10人的概率”。运用二项分布相关知识,若设X为1000个投保人中在未来一年内死亡的人数,则X∶B(1000,0.005),进而事件{在未来一年中这1000个投保人中死亡人数不超过10人}的概率可表示为
  PX≤10=■Ck1000(0.005)k(0.995)1000-k≈0.98652.
  显然,在上面式子中要直接计算Ck1000(0.005)k(0.995)1000-k,k=0,1,2,L,10是相当麻烦的,需要借助简便有效的计算方法。
  二、基于泊松定理的近似计算方法
  定义2.1(泊松分布) 如果随机变量X的可能取值为全体自然数N,且取每个可能值的概率为
  PX=k=■e-?姿,k=0,1,2,L,
  則称随机变量X服从以?姿为参数的泊松分布,其中?姿>0,并记作X∶P(?姿).
  定理2.2(泊松定理[1]) 设?姿>0是一个常数,n是任意正整数,设p=■,则对任一固定的非负整数k,有
  ■Cknpk(1-p)k=■.
  该定理的证明是基础的、通俗易懂的,详细证明过程请参见文献[1]。
  讨论2.3 因为定理2.2中的条件np=?姿(常数)意味着当n很大时p必定很小,所以上述定理表明当n很大,p很小时,有Cknpk(1-p)k≈■,这也就是说此时以n,p为参数的二项分布的概率值可以由参数为?姿=np的泊松分布的概率值近似。实践表明,一般当n≥20,p≤0.05时用■作为Cknpk(1-p)k的近似值效果颇佳。
  回到部分1中的具体例子,因为n=1000远远大于20,p=0.005小于0.05,且有?姿=np=5,所以根据泊松分布定理及讨论2.3,可得
  PX≤10=■Ck1000(0.005)k(0.995)1000-k≈■■e-5≈0.9863.
  三、基于中心极限定理的计算方法
  引理3.1 设随机变量X1,X2,L,Xn独立同分布,且Xi∶B(1,p),i=1,2,L,n,则■Xi∶B(n,p).
  定理3.2(De Moivre-Laplace中心极限定理[2]) 设X1,X2,L是一个独立同分布的随机变量序列,且Xi∶B(1,p),i=1,2,L,Yn=■Xi则对任意一个x∈R,总有
  ■P■≤x=■■e■dt。
  讨论3.3定理3.2 表明当n很大时,可认为Yn近似服从正态分布N(np,npq),其中q=1-p,又根据引理3.1可知Yn∶B(n,p),因此定理3.2可用于二项分布的近似计算。
  再次回到部分1中的具体例子。由于n=1000比较大,且np=5,所以依据定理3.2及讨论3.3,有
  PX≤10=P■≤■≈?椎■≈?椎(2.2417)≈0.9875.
  其中?椎(x),x∈R表示标准正态分布函数。
  四、结束语
  1.文中所举例子表明,基于泊松定理的近似计算结果0.9863要比基于中心极限定理的近似计算结果0.9875更接近精确值0.9865,理论分析和实践验证表明,该结论具有一般性。
  2.文中介绍的这两种近似计算方法具有普适性,即对任意二项分布事件概率计算问题,只要满足近似计算条件,均可用这两种方法进行近似计算。
  [注]伯努利(Bernoulli)概型:实验的可能结果只有两个,实验在相同条件下可重复进行多次且各次实验结果互不影响(即所谓独立重复),在每次实验中两个可能结果发生的概率不变,满足这些条件的随机实验称为伯努利概型。
  此概率值根据式子■Ck1000(0.005)k(0.995)1000-k用Matlab数学软件编程计算得到。
  参考文献:
  [1]盛骤,谢式千,潘承毅.概率论与数理统计[M].北京:高等教育出版社,2009.
  [2]同济大学应用数学系.工程数学·概率统计简明教程[M].北京:高等教育出版社,2003.
其他文献
人体的呼吸系统由鼻、咽、喉、气管、支气管和肺构成。肺和气管是主要呼吸器官。肺位于胸腔内,分左右两部分,左肺两叶,右肺三叶。肺部主要由支气管和肺泡组成,而肺泡是很薄的
美国新泽西州拟立法禁止行人边走路边拿着手机通信,违者可能被罚50美元,或处以15天监禁.有关法例由州议会议员兰皮特提出,规定行人不可在路上行走时收发短信,在公共道路上也
里斯本如花般美得如此脆弱  在葡萄牙里斯本,随处可见贴着瓷砖的墙面:从教堂、宫殿等古建筑,到普通的学校、民居、甚至火车站。它们有些是手绘的蓝白相间图案、也有些是彩色的工业制品,其中不少都已有些年头。但这些瓷砖已经连续数年面临失窃的困境,未来的情况也堪忧。砖墙分布广、细碎、瓷砖追溯难,这些都是监管的障碍。不过,法新社也提到了里斯本市政厅财政紧张,在过去50年一直对瓷砖缺乏维护,再加上瓷砖无法集中到博
期刊
北师大版初中语文九年级(上)第四单元“鉴赏评论”中有一篇小说,虽说篇幅较长,但由于诗情画意般的笔调,浓郁的人情美,教师有必要指导学生阅读,这就要求教师在整体把握的前提
板砖其貌不扬,安静地缩在墙脚的阴影里。  板砖和它的兄弟们一起,等着被盖进大楼里。板砖心里很紧张,因为它今晚刚刚从砖窑里被运到这个地方,它只知道自己是被用来盖房子的,可是今后的命运究竟会怎样,它无从知晓。  黎明很快来临,天空渐渐亮起来,板砖感受到了阳光的暖意。工地上大个子机器开始像做早操一样慢慢地扭动着身体,建筑工人们也推着手推车忙忙碌碌。板砖新奇地看着这一切,看水泥被搅拌成糊糊,看钢筋被吊起来
介绍了安全目标管理与工序安全管理的概念,并探讨了职工安全培训的重要性.
目的:探讨护理干预对预防尿潴留的效果。方法:选择在我院妇科腹腔镜手术患者120例,按住院的先后顺序分为观察组60例、对照组60例,观察组按设计的护理干预措施实施干预,对照组按传
20世纪的伟大发明之一——维生素(Vitamin)又名维他命,是维持人体生命活动必需的一类有机物质,也是保持人体健康的重要活性物质。维生素在体内的含量很少,但在人体生长、代谢