抽样问题的处理方法

来源 :高中生学习·高二版 | 被引量 : 0次 | 上传用户:yy20092
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  为了解决现实生活中我们碰到的很多问题,必须收集相关数据并加以分析. 然而从节约费用等方面考虑,一般是从总体中收集部分个体的数据得出结论,也就是要通过样本情况去推断总体情况. 为了使样本具有好的代表性,设计抽样方法时,最重要的是要将总体“搅拌均匀”,即使每个个体有相同的机会被抽中.
  随机抽样即是建立在随机原则基础上,从总体中抽取部分进行收集数据的方法,是统计学的基础,常用抽样方法有简单随机抽样、分层抽样和系统抽样三种. 这三种抽样方法各有特点,在使用这三种方法时,只有准确把握它们之间的联系与区别,才能准确、合理地从总体中抽取样本. 本文结合具体实例对三种抽样方法的区别与联系加以叙述.
  一、简单随机抽样
  若总体中没有差异明显的层次,一般优先考虑采用简单随机抽样.当总体容量较小时,宜用抽签法;当总体容量较大,样本容量较小时宜用随机数表法.
  例1 为了考查某校的教学水平,抽取这个学校高三年级部分学生本学年考试成绩进行考查. 为了全面地反应实际情况,采取以下三种方式进行抽查:(已知该校高三年级共有20个教学班,并且每个班内的学生已经按随机方式编号了学号,假定该校每班学生人数都相同.)
  (1)从全年级20个班中任意抽取一个班,再从该班中任意抽取20人,考查他们的学习成绩;
  (2)每个班都抽取1人,共计20人,考查这20名学生的成绩;
  (3)把学生按成绩分成优秀、良好、普通三个级别,从中共抽取100名学生进行考查.(已知若按成绩分,该校高三学生中优秀生共150人,良好生共600人,普通生共250人.)
  上面三种抽取方式中各自采用何种抽样方法?
  解析 第一种情况由于总体样本较少,宜采用简单随机抽样;
  第二种情况由于总体样本较多,并且总体中没有明显差异,宜使用系统抽样法和简单抽样法相结合;
  第三种情况由于总体中由成绩差异明显的三层构成,所以宜使用分层抽样法和简单随机抽样法.
  二、系统抽样
  系统抽样相对于简单随机抽样最主要的优势就是经济性,系统抽样方式比简单随机抽样更为简单,花的时间更少,并且花费也少.但使用系统抽样方式最大的缺陷在于总体单位的排列上,系统抽样所得样本的代表性和具体编号有关(简单随机抽样所得样本的代表性与个体的编号无关),如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差.
  例2 某单位在岗职工人数为624人,为了调查工人上班时从离开家到单位平均所用的时间,决定抽取[10%]的工人进行调查,试问最好采用什么抽样方法完成这一抽样?如何抽取?
  解析 由于在岗职工没有明显差异,并且总体人数较多,故适宜采用系统抽样法.首先,将在岗的职工624人用随机方式编号:000,001,002,…,623;第二步,由题知应抽取62人的样本,应为[62462]不是整数,所以应从总体中剔除4人(由于总体容量较多,样本容量较少,故剔除方法宜用随机数表法),将余下的620人,重新编号为000,001,002,…,619分成62段,每段10人,在第一段000,001,002,…,009这十个编号中,用简单随机抽样选取一起始号[i0],则编号[i0,i0+10,i0+20,…,i0+61×10]为所取的样本.
  三、分层抽样
  若总体是由差异明显的几个层次组成,则宜用分层抽样,当抽样比与各层的个体数的乘积是整数时,则该积就是该层的抽样数;当抽样比与各层个体数的乘积不是整数时,则该积经过四舍五入后就是该层的抽样数.
  例3 选择合适的抽样方法抽样,并写出抽样过程.
  (1)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个入样;
  (2)有甲乙厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个入样;
  (3)有甲乙厂生产的300个篮球,抽取10个入样;
  (4)有甲乙厂生产的300个篮球,抽取30个入样.
  解析 应结合三种抽样方法的使用范围和实际情况,灵活地使用各种抽样方法解决问题.
  (1)总体由差异明显的几个层次组成,故选用分层抽样法.
  第一步,确定抽取个数.因为[1030]=[13],所以甲厂生产的应抽取21×[13]=7(个),乙厂生产的应抽取9×[13]=3(个);
  第二步,用抽签法分别在甲厂生产的篮球中抽取7个,在乙厂生产的篮球中抽取3个,这些篮球便组成了我们要抽取的样本.
  (2)总体容量较小,样本容量也小,用抽签法.
  第一步,将30个篮球编号,编号为00,01,02,…,29;
  第二步,将以上30个编号分写在大小形状相同的小纸条上,揉成小球,制成号签;
  第三步,把号签放入一个不透明的袋子中,充分搅匀;
  第四步,在袋子中逐个抽取3个号签,并记录上面的号码;
  第五步,找出和所得号码对应的篮球即为要抽取的样本.


  (3)总体容量较大,样本容量较小,宜用随机数表法.
  第一步,将300个篮球用随机方式编号,编号为:001,002,003,…,300;
  第二步,在随机数表中随机确定一个数作为开始,如第8行第29列的数“7”,任选一个方向作为读数方向,比如向右读;
  第三步,从数“7”开始向右读,每次读取三位,凡不在001~300中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到286,211,234,297,207,013,027,086,284,281这10个号码,这就是所要抽取的10个样本个体的号码.   (4)总体容量较大,样本容量也较大,宜用系统抽样方法.
  第一步,将300个篮球用随机编号,编号为:000,001,002,…,299,并均分成30段;
  第二步,在第一段000,001,002,…,009这十个编号中用简单随机抽样抽出一个(比如002)作为起始号码;
  第三步,将编号为002,012,022,…,292的个体抽出,组成样本.
  总体来看,三种抽样方法在抽样过程中,每个个体被抽到的机会都相等且都是不放回抽取. 简单随机抽样是最基本的抽样方法,适用于总体容量较少的样本,从总体中逐个抽取;系统抽样适用于总体容量较多但单个体差异不大的样本,将样本总体分成几部分,再按预先定出的规则部分抽取;分层抽样适用于由差异明显的若干部分组成的样本,将总体分成几部分,每一部分按比例抽取. 在学习此部分内容时,应该明晰三者间的差别,从而在解题过程中有针对性地使用.
  [练习]
  1.一个单位有职工500人,其中未到35岁的有125人,35到49岁的有280人,50岁以上的有95人,为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本,试问:应用什么方法抽取?能在500人中任意抽取100人吗?能将100个份额均分到这三个部分中吗?
  2.某社区有500个家庭,其中高收入家庭125户,中收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本记作①;某学校高一年级有12名女排球运动员,要从中选出3人调查学习负担情况,记作②. 那么完成上述两项调查采用的抽样方法分别是什么?
  3. 某学校附近的一家小型超市为了了解一年的客流量情况,决定用系统抽样法从一年中抽取52天作为样本实施调查(即从每周抽取1天,一年恰好有52个星期),你觉得这样的选择合适吗?为什么?
  4. 假设甲、乙两种品牌的同类产品在某地区市场上销售量相等,为了解它们的使用寿命,现从这两种品牌的产品中分别各随机抽取100个进行测试,结果统计如下:


  (1)估计甲品牌产品寿命小于200小时的概率;
  (2)这两种品牌产品中,某个产品已使用了200小时,试估计该产品是甲品牌的概率.
  5.为了调查某学校的教学水平,将抽取这个学校高三年级的部分学生本学年的考试成绩进行调查。为了全面反映实际情况,采取以下三种方式进行抽查(已知该学校高三年级共有20个班,并且每个班内的学生按随机方式编好了学号,假定该学校每班学生人数都相同):
  (1)先从全年级20个班中任意抽取1个班,再从该班任意抽取20人,考查这20人的学习成绩;
  (2)从每个班中各抽取1人,共计20人,抽查这20人的成绩;
  (3)把学生按成绩分成优秀、良好、普通三个级别,从中抽取100名学生进行调查(若按成绩分,则该校高三学生中优秀生共150人,良好生共600人,普通生共250人).
  根据上面的叙述,试分别写出三种抽查方式各自抽取样本的步骤.
  [参考答案]
  1. 适宜选用分层抽样法.因为总体中的个体年龄有比较明显的差异,所以不能在500人中任意抽取100人,又因为各部分的人数占总体的比例不同,所以也不能将这100个份额均分到三部分中.
  2. 由于①中总体容量较大,并且家庭收入差异明显,宜使用分层抽样;②中总体容量较小,宜采用简单随机抽样.
  3.从顾客类型及顾客作息时间等方面进行分析,看每周相同的一天是否能很好地反应总体.这个选择不合适,因为超市位于学校附近,其顾客多为学生,其客流量受到学生作息时间的影响,周末时,客流量会明显减少,寒、暑假也会影响超市的客流量,这样必然导致样本不能很好地反映总体,正确的方法是利用简单随机抽样或分层抽样进行抽样,可以把一周分为7天,一年分为52层,每层用简单随机抽样的方法,抽取适当的样本.
  4.(1)甲品牌产品寿命小于200小时的概率为[14].
  (2)已使用了200小时的该产品是甲品牌的概率为[1529].
  5.第一种抽样方式的步骤如下:
  第1步,在这20个班中用抽签法任意抽取1个班;
  第2步,从这个班中用简单随机抽样的方法抽取20名学生,抽查其考试成绩.
  第二种抽样方式的步骤如下:
  第1步,在第1个班中,用简单随机抽样的方法抽取一名学生(其学号为a);
  第2步,在其余的19个班中,选取学号为a的学生,共计20人.
  第三种抽样方式的步骤如下:
  第1步,分层.因为若按成绩分,其中优秀生共150人,良好生共600人,普通生共250人,所以在抽取样本时,应把全体学生分成3层;
  第2步,确定各层抽取的人数.因为样本容量与总体的个体数之比为100∶1000=1∶10,所以在各层抽取的个体数依次为15,60,25;
  第3步,按层次分别抽取.分别在优秀生、良好生、普通生中用系统抽样的方法各抽取15人、60人、25人.
其他文献
还记得北京奥运会的开幕式吗?令人振奋的击缶表演让全场雷动,而一幅跨越时空、意境优美的中国画卷的缓缓舒展,向全世界人们展现博大厚重、意韵悠远的中国故事:清雅古琴声中的笔墨纸砚、被世人称为东方歌剧的京剧表演、中国与外国交通贸易和文化交流的丝绸之路、“天人合一”的太极表演……让人们感受到了不一样的中国。文房四宝、陶瓷、丝绸、太极……这些特色风韵俨然已成为中国最好的宣传片。那么今天我们也来玩一把“中国风”
期刊
淘宝网,中国最大的个人电子商务交易平台。2007年上半年曾创下157亿元的交易额令所有商场超市艳羡不已——这相当于150家沃尔玛门店的收入。据最新的调研机构预计,淘宝网今年交易额将达1000亿人民币。据了解,淘宝网目前有6700万注册用户,每天有1000万的买家访问。中国未来几年一定会超过5亿至6亿的互联网用户,届时中国电子商务每天将会有1亿至2亿的客流,而一般商场很难实现这样的规模。这是一种全新
期刊
这场激烈的对白戏,来自赖声川的舞台剧《暗恋桃花源》。在剧中饰演山茶花云之凡的演员,就是毕业于中央戏剧学院的袁泉。她扮演的女主角云之凡以其纯熟的舞台剧表演功底、高雅清丽的气质获得内地媒体、业界及观众一致好评。有平面媒体在《暗恋桃花源》首演结束后对观众进行了一系列投票,袁泉高票当选观众最喜爱演员。    注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文
期刊
禁不住绿野仙踪的诱惑和妈妈的喋喋不休,利用好不容易到来的学校放月假机会,在掌门“山地车”的组织下,和一帮驴友跟着识途驴“千尺浪”,从客店马湾徒步到温峡水库。全程30千米,时长4个多小时。一些“老驴”的脚都打泡了,我这种“菜驴”,简直就是一次极限考验。  因为是第一次徒步,开始的一段,新鲜感夹着激情,满是愉悦,觉得诗圣在《晦日寻崔戢李封》中“出门无所待,徒步觉自由”的句子,真真写出了野外徒步的轻松。
期刊
8月29日晚,19岁的莫有雪、22岁的谢震业、26岁的苏炳添、28岁的张培萌,这四个中国小伙子创造了历史。在2015年北京世锦赛男子百米接力大战中,时隔18年再回决赛阶段的中国队跑出了38秒01,上演第九道奇迹,摘得银牌,创造了亚洲历史。原本成绩位列第二的美国队因为最后一棒跑出接力区错失奖牌,牙买加队则再次以绝对实力笑傲群雄。这是值得铭记的历史时刻,中国团队在国际田径赛事中获得如此傲人的成绩,其意
期刊
今年7月,19岁的阿乐(化名)考上湖南一所高校。得知儿子考上大学,常德桃源县陬市镇农民高某很高兴,表示要奖励他一台电脑。可自己身体不好挣不到钱,全靠妻子打工维持家用,刚好凑齐儿子的学费,他实在拿不出钱买电脑。  经过几天内心的挣扎,高某想到一个法子。高某来到镇上一电脑专卖店。监控录像显示,当天他进店后便询问了电脑价格,然后匆匆离开。十多分钟后,他又第二次进店,先是合上电脑提了下,发现没锁,再抬头,
期刊
同一个班,生日同年同月同日,家在同一小区同一单元同一楼层。这些,是我与她亲密无间的理由。  我和她,多年以来如同连体婴儿一样,紧紧地缠绕在一起。就像电影里面的“七月”与“安生”,我们分享闺房中的秘密,一起做喜欢的事情。从来没有想过,如果有一天,她离开了我,我该和谁分享自己的心事。  她是个小鹿般的女孩,双眸清澈如水,透着梅花鹿一样的灵气。婴儿肥的脸颊上总挂着浅浅的微笑,尽管我经常拿她的婴儿肥开玩笑
期刊
纪念中国人民抗日战争暨世界反法西斯战争胜利70周年阅兵式(简称9·3阅兵,或者抗战阅兵),是中国政府为纪念中国人民抗日战争暨世界反法西斯战争胜利70周年而开展的众多纪念活动中的一项活动。阅兵于2015年9月3日在北京天安门地区组织实施。  本次阅兵是新中国历史上第15次大阅兵,是进入21世纪以来第2次大阅兵,同时也是第一次在非国庆节举行的大阅兵。  参阅部队从7大军区,海军、空军、第二炮兵、武警部
期刊
江西省吉安市永新县任弼时中学某班级近日发布一条奇葩班规:即日起,除本班学生,本年级理科100名与文科50名以外的同学不得免费进入班内,如需参观的同学请自带100元门票费(非高三年级学生入内是否需要门票另待商榷),公告的班级为高三(12)班,落款时间为2015年9月6日。  外班成绩不优秀者进班收费,够奇葩吧?以至于有人略显偏激地连连发问,班里都是一群珍稀动物吗?可以投喂吗?你当是参观景区呢?收费意
期刊
杰夫·贝索斯,全球最大的互联网书店——亚马逊网络购物中心缔造者,亚马逊CEO,第一位成功的网上零售业者《时代》周刊风云人物。美国《财富》杂志“巨富排行榜”第二;美国《商业周刊》评选的“互联网时代最具影响力的25人”之一。  What I want to talk to you about today is the difference between gifts and choices. Clev
期刊