数据的类别及特征分析

来源 :湖北教育·教育教学 | 被引量 : 0次 | 上传用户:siyuezaici
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  大数据时代背景下,人的数据意识与数据分析能力尤为重要。收集、分析数据的重要目的是研究与解决问题。什么是数据、数据有哪些类型及特点、传统数据与大数据有何区别、如何理解“数据中蕴含着信息”等,是一线教师持续关注的问题。
  数据的不同类别与价值
  数据在科学研究中占据中心地位。大数据时代,数据收集的方式方法发生了翻天覆地的变化,但收集哪些数据的思路并没有改变,仍取决于研究者对研究问题及统计指标的设计。学界对“数据是什么”一直没有明确、统一的解释。李金昌教授认为,可以从两个角度理解数据,狭义的数据就是以数字表现的可进行数学运算的数值,即所谓的结构化数据;广义的数据指一切可以用一定形式记录和反映的客观事实,是信息的表现方式或载体,除了数值、图表,还可以是符号、文字、图像、声音、视频等所谓的非结构化数据,以及其他任何有可能被纳入统计学研究对象的可存在形式。
  随着时代发展,数据可以分为传统数据与大数据。传统数据就是通过调研、实验所获得的结构化数据(即观测数据和实验數据),数理统计学家陈希孺院士将其细分为3个类别:抽样数据、重复测量同一对象数据、试验设计所得数据。目前,小学阶段所研究的数据都是传统数据,以调研观测数据为主。大数据的“大”不是指数据量之大,更强调“全体”的意思。大数据指不限量的数据,是基于现代信息技术的一切可以记录的全体数据,其特征之一是尽量多地包含数据,它与样本容量无关,只与信息来源的数量和储存容量有关。例如,交通监控系统获得的数据(自动产生的数据)、网络上购买东西的数据(驱动产生的数据)等都是大数据。
  从另一个角度看,数据还有统计数据与非统计数据之分。统计数据指能通过统计方法获得并加以处理和分析、用统计语言来表现分析结果的数据。其中,只有契合问题本质和数据形态特征的分析方法才是科学的统计方法,统计语言就是统计指标(变量)和各种图表(包括可视化)。当然,统计数据的界定也不是绝对的,随着研究问题的不断变化,相应的统计方法也会发生变化,随着处理和分析数据能力的增强,统计数据的范围将不断扩大。
  “数据蕴含着信息”是数据存在的最大价值,即数据不仅为了记录,更要从中挖掘出有价值的信息,通过对其筛选与分析得出所需要的结论,或者将其转化为有用的信息解决实际问题。需要注意的是,虚假错误的数据也可以分析出有意义的结果,因此要特别关注数据的来源和真实性。
  关于数据分析观念,课程标准中首要强调“用真实数据说话”的意识与做人做事的态度;其次,通过分析数据发现事物的规律,进而解决实际问题;最后,要学生感悟即使数据是真实的,但统计数据仍具有随机性。
  统计数据的本质特征——随机性
  随机性指事件发生的结果不能由人主观臆想、主观控制。统计数据具有随机性,但小学阶段所涉及的数据分两种情况:一种是不考虑随机性的数据,只针对调查出的数据本身进行描述分析。例如,调研全班学生最爱吃哪种水果、全班学生身高的数据。另一种情况是具有随机性的数据。具有随机性的数据包括两种情况:一是完全随机性,即概率试验所得到的数据,例如抛硬币、掷骰子试验所得到的数据;二是来自现实的数据,既具有一定的随机性,但又不完全随机,属于半随机状态。
  完全随机和完全不随机的数,属于数学研究或数学阐释的范畴,半随机性的数据则由于历史原因归于统计研究的领域。例如,一天中某股票的价格(排除人为操控因素)、某地每天发生的交通事故数、每天上学迟到的学生人数、10次测量一支铅笔的长度(规定精确度)等都是半随机性数据。数据要尽可能排除人为干扰和系统误差,这样通过统计推断所得到的结果才能“更好”,但所得出的结论没有“对错”之分。这与数学结论具有唯一性、确定性等特征不同,这一点也是统计思维与数学思维的本质区别。在小学阶段培养学生的统计思维非常有难度。
  此外,大数据具有4V(Volume大量、Velocity高速、Variety多样、Value价值)特征。史宁中教授认为,大数据还具有“价值稀疏性”,数据量那么大,每天能够产生25亿GB,真正有分析价值的不到0.5%,但一旦有价值就是“价值最大的价值”。
  如何获得数据所蕴含的信息
  数据蕴含着信息,关键要用一定的(或者不同的)方法发现并获得这些信息,用哪些统计方法取决于分析者的判断准则及价值观,但要遵从数据类型,不同类型的数据适合的分析方法也不同。因而,统计既是科学,也是艺术。
  如前所述,对不具有随机性数据的分析称为描述性分析(描述统计),例如可以对数据排序、“分段”整理,或者求最大值、最小值、平均数等获得信息。这些信息是数据“自身携带”的,只需要描述出来,不需要进行推断、估计等思维活动。这类数据最重要的加工方式是对数据“合理分类”。例如,对调研获得的全班学生身高数据进行“合理分段”非常重要,分段前要制定标准,每段“多长(区间长度)”、所分“段数”是多少等都要合理。学会基于“标准”做判断是重要的数学思维。
  教学统计图表时,不应是教师“画好”了,再让学生填写某个“图表”,这样做没有思维价值,不是素养导向的教学。教师应引导学生思考“为什么”,经历“图表”的建构过程。如,怎样设计表头、如何确定统计图中横轴的分类与纵轴的单位等。确定标准的过程就是学会度量的过程。因此,分类与度量是尤为重要的两种数学思想和科学研究方法,制订标准与按标准做事是非常重要的两件事,既涉及能力问题,也涉及情感态度甚至是价值观的问题。
  具有随机性数据的统计分析称为推断分析(推断统计),例如通过求相关系数、回归方程结构模型等,再辅以描述统计的方法,人们就可以获得数据蕴含的更多“隐藏”信息。推断统计的核心是通过已经验了的事物推断未曾经验的事物,或者说通过样本推断总体。因此,抽样问题至关重要。
  李金昌教授认为:统计分析的过程是一个循序渐进的过程,它既容忍误差的存在,又不断在认识过程中控制和降低误差,同时,对分析结论进行评估。在大数据时代背景下,和调研实验数据不一样,大数据的分析更为复杂,虽然小学阶段不要求学生学习大数据,但可以结合学生生活实际让他们知道大数据的存在、了解大数据的价值。
  助理编辑
其他文献
一睁眼儿,天又亮了。俺在西直门过街通道里爬起身,趁这会儿没人,往地沟眼里浇了一泡尿。完了俺就往大街上蹓跶。太阳还没露头,街上的人可就不少了。卖豆浆油条的还是卖豆浆油条,扫大街的还是扫大街,骑车上班的还是骑车上班。公共汽车来了又走了,还是挤得满当当的人。北京这旮人咋恁多呢!俺村里那些从没出过远门的老土坷垃他们一辈子见的人也没俺在北京一天儿见的人多。要不咋说北京这旮好呢,这不是,谁来这儿都不想走,俺也
司马光曾经说过:“若问古今兴废事,请君只看洛阳城”。洛阳,有着十三朝古都的荣光,也有深陷“毁灭一重建一毁灭”的怪圈中蹒跚挣扎的彷徨,对此,司马光想必心有戚戚。  东汉末年,董卓对洛阳的蹂躏还历历在目,曹魏首都洛阳很快便以其独特的“中国速度”拔地而起,矗立在四海之中。公元265年,晋武帝司马炎登基于此,洛阳作为新晋的都城继续延续着奢华,夜凉如水,豪门深宅中,觥筹乱鸣,丝竹共舞,金谷园里的珊瑚树被戏谑
阳雀儿,翘首唱,清翠又明亮,米~贵~阳(呀)~米~贵~阳,唱得春雨润枝芽,唱得嫩绿满山冈。米~贵~阳(呀)~米~贵~阳,早也唱,晚也唱,唱来三月好风光。阳雀儿,翘首唱,清翠又明亮,米~贵~阳(呀)~米~贵~阳,唱得春水翻山岭,唱得雀舌满山冈。米~贵~阳(呀)~米~贵~阳,天也唱,地也唱,唱來百花吐芬芳。(合)唱得雀儿成双对,唱醒么妹梦情郎。唱醉小哥眠春芽,唱来爱情地久天长。2020年8月28日
曾不知夜的恬静,也不知夜会醉人,更不知夜如诗般美丽。只因床前的那扇窗一直紧闭着双眸。  曾经的夜里,房中只有灯光死一般的黄晕,以及自己的心脏无聊地跳动着的声音。  有时,对窗外的夜景会生出一份淡淡的好奇,但很快便消逝了。久而久之,对窗外那未知的夜景只剩一层厚厚的不屑,正如对房间里的景致只有一层厚厚的不屑。因此,一入夜,我的双眸便不再因为什么而敞开了,只躲在被窝里,顺手拭去灯光的黄晕,伴着无聊的心跳
思维素养是语文核心素养之一,如何将其落实到具体的语文课堂教学实践中呢?笔者借《蛇与庄稼》的阅读教学,谈一些看法。  一、紧扣关键词语,激活思维  思维素养的提升需要从小处着手,逐渐扩大思维范围。在教学《蛇与庄稼》时,笔者从词语入手,借助词语的理解来提升学生的思维。  在学生理清课文内容并概括出第一个事例大意后,笔者出示两個句子:1.大家觉得很奇怪;2.有经验的老农想了一个奇怪的办法。两个句子都有“
春山是青的环抱一片大水水是青的搂着群山倒影由此命名这座水库可见庐江人多么沉耽于绿色生命的晨曦跃动于岸边的树悄朵朵白莲花开始绽放时而悬停 时而扑闪蓦然全面翔集白鹭开始一天的蹁跹有一只兀自插入水面激起浪花的音符涟漪似唱片播放美妙的晨曲白云飘逸水面鱼儿穿梭天空渔舟驶过山峦不急于白天的捕捞就像浅滩上的鹭鸶收拢一条腿咪虚着眼 禅定般思索着生态问题这块天然的翡翠是不能开采的宝石她似乎是天的眼洞察人间是否有清澈
说话说贾母、賈夫人正然劝慰巧姐,只见尤二姐从套间内走了出来,叫道:“姥姥快来罢!”刘姥姥听了,就往里跑。又听里面小孩儿呱喇呱喇的啼哭,就知是平儿已经分娩了,忙向尤二姐道:“姑娘,你进去瞧瞧,是大喜呀,是小喜?”尤二姐听了,连忙转身进去。不多一时,走了出来,笑道:“老太太,大喜,是个小子儿。”贾母听了欢喜,道:“今儿真是三喜临门:姑娘出嫁,平儿养儿子,凤丫头又生日。再算上宝玉房里放人,这就是四喜了。
进入“核心素养”时代,语文核心内涵聚焦于“语言建構与运用”“思维发展与提升”“审美鉴赏与创造”“文化传承与理解”四个方面。武汉市江汉区小学语文尝试构建“三立”作文课程体系,勇于实证研究,淬“三立”文化,炼语文学科素养。  如图所示,“三立”作文旨在立德尚美、立言启智、立行修为,倡导在不同的文化场域下,学生能多角度思考,真性情表达,达到正于言、敏于思、慧于文。  立德尚美——蒙以养正,文以化人  学
话说宝玉、宝钗、黛玉三人看罢林公的书启,并抄录大士,真人的奏稿,俱各欢喜不荆宝钗道:“金钏儿,快拿笔砚过来,待我抄录一张带回家去,也教太太听着喜欢喜欢。”金钏儿听了,忙将笔砚送了过来。宝钗道:“林妹妹,你替我抄姑老爷的书子,我自己抄奏稿。”宝玉听了,便换起袖子来替他们研墨,钗、黛二人各取花笺一张,就在灯下一挥而就。宝钗遂又看了一遍,叠了一叠,掖在袖挽儿里。  這里晴雯便送进脸水来,大家梳洗穿衣,刚
王夫人听了,伤心道:“我的儿,你从来不要吃这些油腻东西,可怜见儿的,这都是在大荒山靠的馋透了。莺儿,你去告诉柳家的,把预备老爷晚上吃的烧鹿尾、烧鸭子、锅烧羊肉片一盘子来。我的儿,你可要酌量着吃,可莫要一顿吃多了,那可不是玩的。”又向宝钗道:“我才刚儿是从凤丫头那里来的,我见平儿和巧姐都只张罗了凤丫头,把个尤二姐撂的怪可怜见儿的。我才教你三妹妹和你史大妹妹在他屋里照应着些儿。迎丫头那里,也只有大太太