论文部分内容阅读
“概率与统计”是《数学课程标准》四大内容之一,主要研究现实生活中的数据和客观世界中的随机现象。它通过对数据的收集、整理、描述和分析以及对事件发生可能性的刻画,帮助人们作出合理的推断和预测。在参加小学数学教研活动时,一些教师由于自己对统计的知识掌握得不够,往往表现出顾此失彼、不得要领。笔者认为,提高统计教学实效尚需正本清源,引导教师掌握小学统计教学涉及的相关概念的内涵,消除对有关的概念和判断的认知错误。
一、要对统计有一个明晰的整体认识
作为一种社会实践活动,统计已有四五千年的历史。据《尚书》记载,我国在公元前2000年的贡赋制度和劳役制度中,就已初步形成数量和分组的概念。但作为这种实践活动的经验总结和理论概括的“统计学”,却仅有300多年的历史,与“概率论”的形成基本同步。
统计是研究随机现象的重要方法。随机事件的发生具有偶然性,人们关注其发生的可能性的大小,这种可能性就要借助概率来表示。对于随机事件中的一类特殊事件——等可能性事件,其发生的概率可以直接按概率的古典定义P(A)=来计算,其中n是基本事件的总数,k是事件A中所包含的基本事件的个数。这是一种演绎推理,可以不走统计的路子。然而,在随机事件中,等可能性事件仅是其中的一小部分,绝大多数的随机事件并不具有等可能性。要探求这些非等可能性事件的随机事件发生的概率,唯一的途径就是统计。于是,概率的统计定义P(A)≈便应运而生。其中n是试验的次数,m是事件A发生的次数。当n足够大时,频率呈现出稳定性,这个稳定值就可近似地当做事件A发生的概率。这种概率的获得来自与演绎推理正好相反的归纳推理。
为了对某一随机现象进行研究,人们进行大量重复试验来获取数据,再通过对数据的整理和分析,从中发现规律,这些工作就是统计。由于统计研究的对象是具有偶然性的随机事件,这一事件何时发生、何时不发生,人们无法得到确切的结论,所能得出的结论只是这一事件发生的可能性大约有多大。也就是说,这个随机现象的规律只能借助概率来刻画。正因为如此,统计与概率自然而然地密不可分。不仅中小学教材把概率与统计安排在一块,就是到了大学,也常把“概率论”与“统计学”合并为《概率与统计》一门课程来讲授。有时则习惯地统称为《概率论》。
统计的核心不是列统计表、画统计图、求平均数等知识与技能,统计的核心是统计思想与观念,具体地说,就是数据分析观念。在统计教学中,首先要让学生知道数据中蕴涵着信息,统计就是通过对数据的分析来获取信息,从而作出一些合理的判断的。因此,在教学中要重视发展学生的数据分析观念,让学生懂得对数据的整理和分析是探求规律的重要方法,是科学研究的重要途径。使学生牢固地树立统计思想,扎实地提高统计能力,正是统计教学的总体目标。
统计学可分为“应用统计学”和“数理统计学”两大类,前者属于有各自研究对象的应用数学范畴,如人口统计学、心理统计学、经济统计学等;后者则是研究抽象数量关系的一个“纯数学”分支,是人类认识自然、改造自然、利用自然的有效工具。
我国数学工作者将统计学应用于工农业生产和科学研究,取得了显著成果。例如,将质量控制等统计方法用于制造业,使我国手表、电视机等机电产品的质量得以明显提高。中国科学院系统研究所运用统计方法对我国粮食产量进行预测,连续11年的预测产量与实际产量的平均误差仅为1%。云南大学统计系还将聚类分析和判别分析等统计方法运用于对纸灰的研究,通过对犯罪嫌疑人烧毁罪证后所得纸灰的数据分析,推断出纸张的类别,帮助刑侦部门侦破了多起案件,并因此而获得奖励。
二、要掌握描述数据集中趋势的三个特征数
表示一组数据集中趋势的三个特征数是平均数、中位数和众数,它们既有联系又有区别,都能反映数据的集中程度,但由于各自的角度不同,所以又彼此有别。平均数常用符号表示,= 。中位数常用符号Me表示。对一组数据按大小顺序排列,当数据个数是奇数时,正中间那个数就是中位数;当数据个数是偶数时,正中间那两个数的平均值就是中位数。而在一组数据中,出现次数最多的那个数就称为众数。众数常用称号Mo表示。值得注意的是,在一组数据中,有时众数可能不止一个,有时也可能没有众数。
用平均数描述一组数据的集中趋势,具有较大的可靠性,但它的缺点是易受极端数据的影响。中位数的优点是不受极端数据的影响,即使两端存在未知数据时,中位数依然可以求得。众数的出现只与数据出现的频数有关,也不受极端数据的影响。
事实上,当数据呈正态分布时,平均数、中位数和众数将会“三位一体”,取同一数值。只有在偏态的情况下,它们才会有所不同。
平均数是刻画集中趋势的首选特征数。在这三个特征数中,最有价值、用得最多的无疑是平均数。平均速度、平均身高、平均工资、平均寿命、平均温度、平均降雨量、平均能耗等,人们早已耳熟能详。学校也经常用班级的平均分数来对各班成绩进行衡量。而用中位数或众数来给各班的成绩定优劣、给各个教师的教学质量定高低之举,人们却鲜有耳闻。这是为什么呢?
首先,这是因为平均数具有另两个特征数都不具备的独特优点:它用到了组内所有数据的信息。平均数既然是由全体数据“糅合”而成,那么用它来刻画这组数据的集中程度和整体水平,当然就最合理、最可靠、最令人信服。
其次,平均数易受极端数据影响的缺点可以借助一些技术手段予以克服。例如,在跳水比赛中,运动员的成绩评定就是通过从所有裁判的评分中去掉一个最高分和去掉一个最低分得出的;而在我国中央电视台举办的青年歌手电视大奖赛中,由于评委的人数较多,在算平均分前,则要去掉两个最高分和两个最低分。
人教版义务教育标准实验教科书《数学》五年级下册第122页例1,给出了20个舞蹈队员的身高数据(单位是m),其中有7个1.52,1.52是众数。此时,以众数为标准从这20人中挑选10人参加比赛的确是最佳方案。值得注意的是,编者是借此例题引入“众数”概念,千万别以为凡遇类似情形都一律要以众数为标准。实际上,只要这组数据稍有变动,完全可以使得按平均数或中位数来挑选10人的方法优于按众数来选人的方法,从而成为最佳方案。教师须防止思维的片面和绝对,学会具体问题具体分析。
平均数对后续学习仍起作用。升入初中后,学生还要学习表示离散程度的一些特征数,而这类特征数大都要用到平均数的概念,如方差S2的定义是:S2=(xi-)2 ;标准差S的定义是S= ;变异系数CV的定义是:CV= •100%。在这些定义式中,都能发现平均数 的身影,而中位数Me和众数Mo则已销声匿迹、踪影全无。到高中,还会遇到一个重要的统计概念——数学期望。数学期望常用符号Eξ表示,其本质就是随机变量ξ的概率平均数,它是平均数的更一般的形式。了解了这一点,教师就应更加重视平均数的教学,而不要在三个特征数上平均使用力量。
须补充说明的是,按内容分,统计可分为描述统计与推断统计两大块。像整理数据、制表、绘图、计算各种统计量等,均属描述统计;而像通过对样本的分析,对总体作出推断,就属于推断统计。小学阶段的统计内容,基本上都属于描述统计,要到初中才学习抽样和用样本估计总体。而实际上,推断统计才是最有趣的,也最能体现统计的探究性价值。因此,为了让学生喜爱数据,学会分析数据,并初步领悟由局部推断总体的统计思想,小学数学教师在教学中可以编拟一些简单的推断题,让学生做适当的练习。(作者单位:南昌师范高等专科学校)
□责任编辑 邓园生
E-mail: jxjydys@126.com
一、要对统计有一个明晰的整体认识
作为一种社会实践活动,统计已有四五千年的历史。据《尚书》记载,我国在公元前2000年的贡赋制度和劳役制度中,就已初步形成数量和分组的概念。但作为这种实践活动的经验总结和理论概括的“统计学”,却仅有300多年的历史,与“概率论”的形成基本同步。
统计是研究随机现象的重要方法。随机事件的发生具有偶然性,人们关注其发生的可能性的大小,这种可能性就要借助概率来表示。对于随机事件中的一类特殊事件——等可能性事件,其发生的概率可以直接按概率的古典定义P(A)=来计算,其中n是基本事件的总数,k是事件A中所包含的基本事件的个数。这是一种演绎推理,可以不走统计的路子。然而,在随机事件中,等可能性事件仅是其中的一小部分,绝大多数的随机事件并不具有等可能性。要探求这些非等可能性事件的随机事件发生的概率,唯一的途径就是统计。于是,概率的统计定义P(A)≈便应运而生。其中n是试验的次数,m是事件A发生的次数。当n足够大时,频率呈现出稳定性,这个稳定值就可近似地当做事件A发生的概率。这种概率的获得来自与演绎推理正好相反的归纳推理。
为了对某一随机现象进行研究,人们进行大量重复试验来获取数据,再通过对数据的整理和分析,从中发现规律,这些工作就是统计。由于统计研究的对象是具有偶然性的随机事件,这一事件何时发生、何时不发生,人们无法得到确切的结论,所能得出的结论只是这一事件发生的可能性大约有多大。也就是说,这个随机现象的规律只能借助概率来刻画。正因为如此,统计与概率自然而然地密不可分。不仅中小学教材把概率与统计安排在一块,就是到了大学,也常把“概率论”与“统计学”合并为《概率与统计》一门课程来讲授。有时则习惯地统称为《概率论》。
统计的核心不是列统计表、画统计图、求平均数等知识与技能,统计的核心是统计思想与观念,具体地说,就是数据分析观念。在统计教学中,首先要让学生知道数据中蕴涵着信息,统计就是通过对数据的分析来获取信息,从而作出一些合理的判断的。因此,在教学中要重视发展学生的数据分析观念,让学生懂得对数据的整理和分析是探求规律的重要方法,是科学研究的重要途径。使学生牢固地树立统计思想,扎实地提高统计能力,正是统计教学的总体目标。
统计学可分为“应用统计学”和“数理统计学”两大类,前者属于有各自研究对象的应用数学范畴,如人口统计学、心理统计学、经济统计学等;后者则是研究抽象数量关系的一个“纯数学”分支,是人类认识自然、改造自然、利用自然的有效工具。
我国数学工作者将统计学应用于工农业生产和科学研究,取得了显著成果。例如,将质量控制等统计方法用于制造业,使我国手表、电视机等机电产品的质量得以明显提高。中国科学院系统研究所运用统计方法对我国粮食产量进行预测,连续11年的预测产量与实际产量的平均误差仅为1%。云南大学统计系还将聚类分析和判别分析等统计方法运用于对纸灰的研究,通过对犯罪嫌疑人烧毁罪证后所得纸灰的数据分析,推断出纸张的类别,帮助刑侦部门侦破了多起案件,并因此而获得奖励。
二、要掌握描述数据集中趋势的三个特征数
表示一组数据集中趋势的三个特征数是平均数、中位数和众数,它们既有联系又有区别,都能反映数据的集中程度,但由于各自的角度不同,所以又彼此有别。平均数常用符号表示,= 。中位数常用符号Me表示。对一组数据按大小顺序排列,当数据个数是奇数时,正中间那个数就是中位数;当数据个数是偶数时,正中间那两个数的平均值就是中位数。而在一组数据中,出现次数最多的那个数就称为众数。众数常用称号Mo表示。值得注意的是,在一组数据中,有时众数可能不止一个,有时也可能没有众数。
用平均数描述一组数据的集中趋势,具有较大的可靠性,但它的缺点是易受极端数据的影响。中位数的优点是不受极端数据的影响,即使两端存在未知数据时,中位数依然可以求得。众数的出现只与数据出现的频数有关,也不受极端数据的影响。
事实上,当数据呈正态分布时,平均数、中位数和众数将会“三位一体”,取同一数值。只有在偏态的情况下,它们才会有所不同。
平均数是刻画集中趋势的首选特征数。在这三个特征数中,最有价值、用得最多的无疑是平均数。平均速度、平均身高、平均工资、平均寿命、平均温度、平均降雨量、平均能耗等,人们早已耳熟能详。学校也经常用班级的平均分数来对各班成绩进行衡量。而用中位数或众数来给各班的成绩定优劣、给各个教师的教学质量定高低之举,人们却鲜有耳闻。这是为什么呢?
首先,这是因为平均数具有另两个特征数都不具备的独特优点:它用到了组内所有数据的信息。平均数既然是由全体数据“糅合”而成,那么用它来刻画这组数据的集中程度和整体水平,当然就最合理、最可靠、最令人信服。
其次,平均数易受极端数据影响的缺点可以借助一些技术手段予以克服。例如,在跳水比赛中,运动员的成绩评定就是通过从所有裁判的评分中去掉一个最高分和去掉一个最低分得出的;而在我国中央电视台举办的青年歌手电视大奖赛中,由于评委的人数较多,在算平均分前,则要去掉两个最高分和两个最低分。
人教版义务教育标准实验教科书《数学》五年级下册第122页例1,给出了20个舞蹈队员的身高数据(单位是m),其中有7个1.52,1.52是众数。此时,以众数为标准从这20人中挑选10人参加比赛的确是最佳方案。值得注意的是,编者是借此例题引入“众数”概念,千万别以为凡遇类似情形都一律要以众数为标准。实际上,只要这组数据稍有变动,完全可以使得按平均数或中位数来挑选10人的方法优于按众数来选人的方法,从而成为最佳方案。教师须防止思维的片面和绝对,学会具体问题具体分析。
平均数对后续学习仍起作用。升入初中后,学生还要学习表示离散程度的一些特征数,而这类特征数大都要用到平均数的概念,如方差S2的定义是:S2=(xi-)2 ;标准差S的定义是S= ;变异系数CV的定义是:CV= •100%。在这些定义式中,都能发现平均数 的身影,而中位数Me和众数Mo则已销声匿迹、踪影全无。到高中,还会遇到一个重要的统计概念——数学期望。数学期望常用符号Eξ表示,其本质就是随机变量ξ的概率平均数,它是平均数的更一般的形式。了解了这一点,教师就应更加重视平均数的教学,而不要在三个特征数上平均使用力量。
须补充说明的是,按内容分,统计可分为描述统计与推断统计两大块。像整理数据、制表、绘图、计算各种统计量等,均属描述统计;而像通过对样本的分析,对总体作出推断,就属于推断统计。小学阶段的统计内容,基本上都属于描述统计,要到初中才学习抽样和用样本估计总体。而实际上,推断统计才是最有趣的,也最能体现统计的探究性价值。因此,为了让学生喜爱数据,学会分析数据,并初步领悟由局部推断总体的统计思想,小学数学教师在教学中可以编拟一些简单的推断题,让学生做适当的练习。(作者单位:南昌师范高等专科学校)
□责任编辑 邓园生
E-mail: jxjydys@126.com