论文部分内容阅读
摘要:在分层抽样中出现在各层抽取的个体个数不是整数的情况下,如何取舍才能使分层抽样方法更具有合理性与公平性.
关键词:分层抽样
分层抽样是人教教育出版社B版必修3第二章第一节的内容,教材在前面的两个课时学习了简单随机抽样和系统抽样后接着讲述的第三种随机抽样方法. 学生在学习了前面的简单随机抽样和系统抽样,并对统计知识有了一定的了解后,学习本节内容从理论上本应该不存在障碍. 但是,由于第59页练习A中第3题以及练习B中出现在各层抽取的个体个数不是整数的情况,面临如何取舍才能使分层抽样方法更具有合理性与公平性的问题,针对该问题老师在教学中以及网上讨论得沸沸扬扬,有的采用简单的四舍五入法取舍,也有的根据方差的大小进行取舍,等等. 在这里笔者将自己解决这两个问题的教学过程介绍如下,愿与同仁共同探讨.
问题1 (第59页练习B)某市电视台在因特网上征集电视节目的现场参与观众,报名的共有12000人,分别来自4个城区,其中东城区2400人,西城区4605人,南城区3795人,北城区1200人,用分层抽样的方式从中抽取60人参加现场节目,应当如何抽取?
分析 该问题总体由明显差异的三部分组成,故考虑用分层抽样的方法.
我们易知东城区应抽取人数为×60=12,西城区应抽取人数为×60=23.025,南城区应抽取人数为×60=18.975,北城区应抽取人数为×60=6.
这样,有些层面上抽取的学生数不再是整数,像这样的情况在现实中是比较普遍的,那么这时该怎么取呢?此时很多老师想到的是“四舍五入”法. 那么,“四舍五入”法是否具有“普遍性”呢?
问题2 (第59页练习A中第3题)某大学就餐中心为了了解新生的饮食习惯,以分层抽样的方式从1500名新生中抽取200名进行调查,新生中的南方学生有500名,北方学生有800名,西部地区的学生有200名,应如何抽取?
分析 该问题总体由明显差异的三部分组成,故仍考虑用分层抽样的方法.
我们易知南部地区学生人数为×500≈66.7,北部地区学生人数为×800≈106.7,西部地区学生人数为×200≈26.7. 三者的小数部分完全一样,若按四舍五入法都进上,则总数就多1个名额,刚才考虑的“四舍五入”法很明显行不通了. 那能不能找到一个更具普遍性的方法呢?
要解决这个问题,必须找到一个相对公平的指标.假设在总体中A,B所占人数分别为p1,p2,在样本容量中各占人数n1,n2,显然仅当=时,分配才是公平,但是以上问题中出现了≠的情况,这时分配不公平,并且(i=1,2)数值较大的一方吃亏,或者说对这一方不公平.当>,不公平程度可以用-衡量. 例如p1=120,p2=100,n1=n2=10,-=12-10=2,它衡量的是不公平的绝对程度,常常无法区分两种程度明显不同的不公平情况.例如上述双方人数增加为p1=1020,p2=1000,n1=n2=10,-=102-100=2,即绝对不公平程度不变. 但是常识告诉我们,后面这种情况的不公平程度比起前面来已经大为改善了. 为了改进上述绝对标准,我们就要建立衡量分配不公平程度的数量. 根据相对不公平度的原理,我们由Qi=,i=1,2,3…m的大小来决定当不能整除时,剩余名额的分配问题. 即将剩余名额逐个分配,每增加一个,就将增加的一个名额分配给Q值最大的一方.
例如在问题2中,按照分层抽样的原则,各层应抽的人数都不是整数,各整数部分和为66+106+26=198人,各层按整数部分配后还剩余2个名额,那么这剩余的2个名额又该给谁呢?按照上述相对不公平度的原理将剩余2个名额逐一分配,首先分配第199个名额,计算Q1==56.54,Q2==56.43,Q3==56.98,Q3最大,于是第199个名额应分配给西部.再分配第200个名额,Q1,Q2的值不变Q3==52.91,此时Q1最大,则第200个名额应分配给南部. 所以本问题的最终分配方案为:200个名额应从南方学生中抽取67人,从北方学生中抽取106人,从西方学生中抽取27人.
在利用此方法解决问题1,各整数部分和为12+23+18+6=59人,各层按整数部分配后还剩余1个名额,那么这剩余的1个名额该给西城区还是给南城区呢?仍按照上述相对不公平度的原理分配剩余1个名额,计算Q2==38416.7,Q3==42111.2,Q3大,所以分给南部地区.
所以本问题的最终分配方案为:60个名额应从东城区抽取12人,从西城区抽取23人,从南城区抽取19人,从北城区抽取6人.这一结果与利用四舍五入所得的方案相同,这只能说明是一种巧合.
课后记:这种方法计算较简单,分配相对公平,学生易于接受,教学效果好.
参考文献
数学模型(姜启原、谢金星、叶俊)
关键词:分层抽样
分层抽样是人教教育出版社B版必修3第二章第一节的内容,教材在前面的两个课时学习了简单随机抽样和系统抽样后接着讲述的第三种随机抽样方法. 学生在学习了前面的简单随机抽样和系统抽样,并对统计知识有了一定的了解后,学习本节内容从理论上本应该不存在障碍. 但是,由于第59页练习A中第3题以及练习B中出现在各层抽取的个体个数不是整数的情况,面临如何取舍才能使分层抽样方法更具有合理性与公平性的问题,针对该问题老师在教学中以及网上讨论得沸沸扬扬,有的采用简单的四舍五入法取舍,也有的根据方差的大小进行取舍,等等. 在这里笔者将自己解决这两个问题的教学过程介绍如下,愿与同仁共同探讨.
问题1 (第59页练习B)某市电视台在因特网上征集电视节目的现场参与观众,报名的共有12000人,分别来自4个城区,其中东城区2400人,西城区4605人,南城区3795人,北城区1200人,用分层抽样的方式从中抽取60人参加现场节目,应当如何抽取?
分析 该问题总体由明显差异的三部分组成,故考虑用分层抽样的方法.
我们易知东城区应抽取人数为×60=12,西城区应抽取人数为×60=23.025,南城区应抽取人数为×60=18.975,北城区应抽取人数为×60=6.
这样,有些层面上抽取的学生数不再是整数,像这样的情况在现实中是比较普遍的,那么这时该怎么取呢?此时很多老师想到的是“四舍五入”法. 那么,“四舍五入”法是否具有“普遍性”呢?
问题2 (第59页练习A中第3题)某大学就餐中心为了了解新生的饮食习惯,以分层抽样的方式从1500名新生中抽取200名进行调查,新生中的南方学生有500名,北方学生有800名,西部地区的学生有200名,应如何抽取?
分析 该问题总体由明显差异的三部分组成,故仍考虑用分层抽样的方法.
我们易知南部地区学生人数为×500≈66.7,北部地区学生人数为×800≈106.7,西部地区学生人数为×200≈26.7. 三者的小数部分完全一样,若按四舍五入法都进上,则总数就多1个名额,刚才考虑的“四舍五入”法很明显行不通了. 那能不能找到一个更具普遍性的方法呢?
要解决这个问题,必须找到一个相对公平的指标.假设在总体中A,B所占人数分别为p1,p2,在样本容量中各占人数n1,n2,显然仅当=时,分配才是公平,但是以上问题中出现了≠的情况,这时分配不公平,并且(i=1,2)数值较大的一方吃亏,或者说对这一方不公平.当>,不公平程度可以用-衡量. 例如p1=120,p2=100,n1=n2=10,-=12-10=2,它衡量的是不公平的绝对程度,常常无法区分两种程度明显不同的不公平情况.例如上述双方人数增加为p1=1020,p2=1000,n1=n2=10,-=102-100=2,即绝对不公平程度不变. 但是常识告诉我们,后面这种情况的不公平程度比起前面来已经大为改善了. 为了改进上述绝对标准,我们就要建立衡量分配不公平程度的数量. 根据相对不公平度的原理,我们由Qi=,i=1,2,3…m的大小来决定当不能整除时,剩余名额的分配问题. 即将剩余名额逐个分配,每增加一个,就将增加的一个名额分配给Q值最大的一方.
例如在问题2中,按照分层抽样的原则,各层应抽的人数都不是整数,各整数部分和为66+106+26=198人,各层按整数部分配后还剩余2个名额,那么这剩余的2个名额又该给谁呢?按照上述相对不公平度的原理将剩余2个名额逐一分配,首先分配第199个名额,计算Q1==56.54,Q2==56.43,Q3==56.98,Q3最大,于是第199个名额应分配给西部.再分配第200个名额,Q1,Q2的值不变Q3==52.91,此时Q1最大,则第200个名额应分配给南部. 所以本问题的最终分配方案为:200个名额应从南方学生中抽取67人,从北方学生中抽取106人,从西方学生中抽取27人.
在利用此方法解决问题1,各整数部分和为12+23+18+6=59人,各层按整数部分配后还剩余1个名额,那么这剩余的1个名额该给西城区还是给南城区呢?仍按照上述相对不公平度的原理分配剩余1个名额,计算Q2==38416.7,Q3==42111.2,Q3大,所以分给南部地区.
所以本问题的最终分配方案为:60个名额应从东城区抽取12人,从西城区抽取23人,从南城区抽取19人,从北城区抽取6人.这一结果与利用四舍五入所得的方案相同,这只能说明是一种巧合.
课后记:这种方法计算较简单,分配相对公平,学生易于接受,教学效果好.
参考文献
数学模型(姜启原、谢金星、叶俊)