提升数据分析素养

来源 :中学生数理化·七年级数学人教版 | 被引量 : 0次 | 上传用户:xigua871030
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  我们生活的世界正处在信息时代,每天纷繁复杂的信息充斥着我们的生活.数据作为信息的一种重要载体.成为刻画信息、获取信息必不可少的媒介.为了更好地适应现实生活,我们不僅要学会收集数据,更要学会对收集到的数据进行加工处理.进而做出评判.
  2020年新冠肺炎疫情期间,每天看到最多的信息就是新冠肺炎疫情实时数据,
  伴随着以“数据量大、类型繁多等”为主要特征的大数据时代的到来,人们常常需要对网络、文本、声音、图像等反映的信息进行数字化处理,这使数学的研究领域与应用领域得到极大拓展.数据分析已经深入到科学、技术、工程和现代社会生活的方方面面.数据的收集与处理能力已成为现代公民的一个基本素质要求.
  一、本章要学的内容
  “数据的收集、整理与描述”是数据分析的主要组成部分,也是我们在本章将要学习的内容.
  在初中数学中,数据分析主要表现为:收集和整理数据,理解和处理数据,获得和解释结论.
  在小学阶段,我们已经经历了数据收集的过程,并会对数据收集的结果进行简单表示.
  在此基础上,我们将围绕数据收集的两种类型(全面调查和抽样调查)、数据的整理(统计表)、数据的描述(统计图)进行学习,期望通过学习,我们能够掌握收集数据的一些基本方法,掌握整理数据和直观形象地描述数据的方法,并学会发现数据蕴含的规律、获取我们需要的信息的本领.
  二、怎么学这些内容
  与数学其他领域的学习相比,这一章需要同学们亲身参与统计过程,从而积累数据分析的直接经验,形成数据收集、整理和描述的知识、技能,进而掌握统计活动中的思想方法.
  (一)直接利用生活中的数据开展本章的学习
  当今时代是以“数据量大、类型繁多等”为主要特征的大数据时代,报纸、杂志、电视、互联网等媒体中,充满了大量数据和统计表格,我们可以直接利用这些资源开展本章的学习,
  生活中的数据一般分两种.一是已有数据,通常需要我们加以合理分析,二是需要我们设法收集数据,诸如班级竞选、公司竞聘、招标投标、意见反馈、产品抽检、课题研究等.对于生活中的这些问题,通常采用调查的方法,
  调查是生活中必备的一种科学研究方法,包括数据的收集(调查问卷的设计、数据收集方法的选择)、整理与描述、分析.准确阐释数据背后所传达的信息(即“读懂”数据),能帮助我们做出合理决策,解决问题.
  “读懂”数据的基本前提有两个,一是判断获取数据来源的基本途径是否可信、是否具有代表性,二是准确描述、整理和分析这些数据.
  (二)亲身经历发现问题、提出问题、分析问题、解决问题的全过程
  与代数、几何领域的数学学习相比,统计领域的数学学习更需要我们亲身经历统计的全过程.
  (三)把握一些概念之间的关系
  学习本章,必须把握好一些概念之间的关系.
  1.全面调查与抽样调查.
  在以往的学习中,我们接触的问题主要是数据统计初步,调查对象一般比较简单,通常对调查对象进行全员调查,这就是数据收集的一种典型类型:全面调查,
  全面调查是专门组织的、一次性的调查,用来调查属于一定时点上或一定时期内的社会现象总量.这种方法可以让我们获得全面翔实的数据.
  但是,现实生活中的数据往往纷繁复杂.比如,调查某地区居民的健康状况,如果要对每位居民都进行调查,不仅费时、费力,而且往往很难奏效,再如测试一批洗衣机的使用寿命,每一次测试往往都要消耗一台洗衣机,即使总体的规模不大,但对每台洗衣机都进行消耗性测试几乎是不可能的.故当总体中的个体数目比较多、全面调查工作量比较大,或者受客观条件的限制而无法对所有的个体进行调查,或者这种调查具有破坏性而不允许全面调查时,人们往往需要从总体中抽取一部分个体进行调查,这种调查方式就是抽样调查,其中,从总体中抽取的部分个体叫作总体的一个样本,
  在现实生活中,如何选用恰当的调查方法进行数据的收集,常常需要具体情况具体分析.
  2.样本与总体.
  总体是所要考察对象的全体,而样本是从总体中抽出的一部分个体.因而,样本是总体的一部分,与总体之间构成部分与整体的关系.选取样本更深层含义在于通过样本来了解总体,即通过调查或观察样本的某种特征,来了解或推断总体的相应特征.对于全面调查和抽样调查,前者需要通过对所有个体的特征进行全面的归纳、概括进而得到总体的特征,而后者需要利用部分个体的特征来推断总体的特征.这种由部分推断总体的统计方法正是数学归纳思想的体现.
  3.频率与频数.
  对此,我们可以从两个方面进行思考.
  一方面,我们要体会频数和频率的含义及其异同.频数和频率其实都是在对统计数据进行分类整理的过程中产生的,频数指的是每一个对象出现的次数,而频率则是指每个对象出现次数与总次数的比值,
  例如,在某社区居民健康状况的调查中,共抽取了100人,其中,处于亚健康状态的有46人,那么,处于亚健康状态的频数就是46,其频率就是46/100 =0.46.
  另一方面,我们要掌握绘制频数分布直方图的基本技能.
  所谓频数分布直方图,类似条形统计图,所不同的是,频数分布直方图的纵轴表示频数与组距的比值,横轴多表示连续型统计量,而在此之前我们所见到的条形统计图的横轴大多数表示离散型统计量.
  借助频数分布直方图,我们可以更加形象直观地体现不同对象在频数和频率上的差异.
  需要特别指出的是,与绘制离散型统计量的条形统计图不同,绘制连续型统计量的频数分布直方图一般要经历如下步骤.
  (1)计算统计数据的最大值与最小值的差(极差),确定统计量的范围.
  (2)确定组数和组距.一般而言,数据越多,分的组也应越多,当数据在100个以内时,通常按照数据的多少分成5—12组.在实际分组时,应该视具体情况选择合适的组数.组数确定以后,用极差除以组数,可以得到组距.在实践中,通常要求各组的组距相等.   (3)确定分点,根据组距,按顺序确定各个分点,有时可以将最小值减小一点作为最左端的分点,将最大值增大一点作为最右端的分点,当然,两边的组距也可以与其他组距不相等.
  (4)列频数分布表:可采用唱票法等方法进行累计.
  (5)画频数分布直方图,
  特别地,由于我们绘制的是连续型统计量的频数分布直方图,故各个“条形”之间应该是连续的,而不应该有间隔.当各组的组距相等时,所画的各个“条形”的宽度也应该相同.
  三、学以致用
  衡量我们学习效果的一个重要指标就是学以致用.
  1.学會读图.
  当今信息时代的日常生活中充斥着各种各样的数据,这些数据以及对其形象化处理的统计图表,给人们带来巨大的直观冲击,因此有人戏称我们进入了一个“读图时代”.为了能在这个“读图时代”更好地生存,我们必须能从大量图表中获取有用信息,甄别无用信息、虚假信息,将干扰信息的影响降到最低限度.
  2.学会基于数据的推断.
  面对大量信息,我们要学会基于数据的收集、整理,寻找其中的规律,进而做出恰当的推断,此时,选择恰当的方法至关重要.
  比如,养鱼人员估计鱼池中鱼的条数时,不需要把鱼池的水抽干,逐条检查鱼的数量,只需要用网捉住其中一部分鱼,做好标记,再放回去,等鱼已经完全混在整个鱼池中了,再用网捉一部分鱼,分析此时网中含标记的鱼的条数占整网鱼的比例,就可以推断出整个鱼池中鱼的数量.
  如果从鱼池中随机捞出一网鱼,总计298条,给每条鱼做好标记,全部放回鱼池中,等鱼混在一起后,再捞出一网,总计302条鱼,其中,有标记的鱼有4条,那么,整个鱼池中大约有鱼(302÷4)x298=22 499(条).
  其他类似的问题诸如“森林中某种动物的个数”等,也可按此法解决,这个方法体现了用样本估计总体的思想.而教科书的实验与探究内容“瓶子中有多少粒豆子”,也是用这个方法解决问题的.希望大家通过活动体验这个方法,感受用样本估计总体的思想.
  3.学会探寻数据之间的变化规律.
  面对一些现象,尽管数据纷繁复杂,似乎无规律可循,但是,只要数据积累多了,将相关数据合理排列,从中总能找到数据的变化规律.
  例1 下页图1和图2分别是甲、乙两位党员在一天中使用“学习强国”学习各项目所用时间的统计图,根据统计图对两人各自学习“文章”时间占一天总学习时间的百分比做出的判断中,正确的是( ).
  A.甲比乙多
  B.甲比乙少
  C.甲和乙一样多
  D.甲和乙无法比较
  分析:先由扇形统计图可知,乙党员学习“文章”时间占一天总学习时间的百分比是20%,再由条形统计图求出甲党员学习“文章”时间占一天总学习时间的百分比,进行比较即可,
  解答:由扇形统计图可知,乙党员学习“文章”时间占一天总学习时间的百分比是20%.由条形统计图求出甲党员学习“文章”时间占一天总学习时间的百分比是15÷(15 30 10 5) x100%=25%,所以甲党员学习“文章”时间占一天总学习时间的百分比比乙党员的多.故正确选项是A.
  点评:本题考查条形统计图和扇形统计图的综合运用.读懂统计图,从不同的统计图中获得必要的信息是解决问题的关键.
其他文献
针对新形势下的政府信息公开进行研究,认为当前的政府信息公开存在以下三方面的挑战:信息时代的挑战、公民意识的挑战、政府职能的挑战;并试着从政府的创新与实干、公众的权
在分析传统图书资料修复方法的基础上,提出一种新的数字图书资料自动修复的计算机处理方法,阐述模式识别技术在数字图书资料自动修复和整理中的应用,该方法通过对图书资料进行扫描、二值化和图像重建等处理,达到对不清晰的图书资料自动修复的目的,以期实现数字图书资料的数字化处理。最后通过一个实例验证了该方法的有效性与实用性。
提出一种基于网页内容分割的Web信息检索算法.该算法根据网页半结构化的特点,按照HTML标记和网页的内容将网页进行区域分割.在建立HTML标记树的基础上,利用内容相似性和视觉
论述政府信息服务绩效测评既是以结果为本的控制机制,也是用户至上的服务机制。平衡记分卡在政府信息服务绩效测评中的适用性取决于平衡记分卡的平衡理念、将战略目标转换为
介绍20世纪50年代中苏两国在图书馆事业上交流的基本情况,在分析前苏联图书馆事业管理思想和实践对我国图书馆事业、图书馆学研究及专业教育具体影响的基础上,全面评价这一时
清代内府刻书承明余绪,但远超前朝。无论在刻书机构、刻书制度的建立上,还是在刻书的质量、品种、数量上,以往历代皆不能望其项背。清代内府本的种类、数量、技艺、装潢等都取得
介绍20世纪初,近现代中国先进知识分子仿效近现代西方公共图书馆运动的精神与办馆理念,掀起一场持续近20年的新图书馆运动(1917-1936年),力图革除封建藏书楼的陋习,提倡图书
我国美丽乡村发展进入瓶颈期.大量美丽乡村建设规划内容以规划布局、基础设施建设、经济发展策略为重点,缺乏对乡村生态景观环境的关注,使得乡村生态系统遭到破坏、景观破碎
第27期图书情报工作岗位培训班由中国图书馆学会专业图书馆分会举办的“图书情报工作岗位培训班”自1981年创办以来,每年一期,每期历时6个月,已走过了27年的历程。该班是北京
移动通信技术与图书馆的发展融合产生了移动信息服务。短信息服务具有收费低廉、简单易用、便捷等优点,提供可靠的无线数据业务。用户无需纸和笔记录,内容可以存储,并且可以随时