论文部分内容阅读
【摘 要】大数据、可视化、智能分析……这些信息时代的新技术冲击着我们的认知,在领略飞奔的技术的同时感觉既熟悉又茫然。本文以制作北京市新冠肺炎疫情交互型可视化数据报告为例,尝试从技术实现和教学策略角度阐述信息技术教学中对数据分析内容的探究。
【关键词】数据分析;可视化;大数据;Power Bi
【中图分类号】434 【文献标识码】B
【论文编号】1671-7384(2020)011-076-04
2017版普通高中信息技术课程标准中强调:“构建具有时代特征的学习内容,将知识构建、技能培养与思维发展融入运用数字化工具解决问题和完成任务的过程中。”而数据作为信息时代的基石以及一切数字化工具的根本资源,越来越受到大家的重视。让学生了解和体会数据分析和可视化表达更是必修模块中的重要环节。
日常生活中的“数据”和“枯燥”一词形影不离,大数据更是远看光鲜亮丽,近看无从下手。如何打破僵化局面,带给学生易于实现且富有视觉冲击的数据分析课程,是我们每位信息技术教师关心的问题。但是,无论是Excel视觉图表,还是Python词云展示,似乎都略显单薄,无法引领学生一窥大数据的风采。本文将从技术实现过程和教学策略角度阐述数据分析课程的探索与尝试。
工具选择和数据来源
工欲善其事,必先利其器。选用适合的数字化工具进行协作学习和解决问题正是在培养学生“数字化学习与创新”核心素养。一款上手简单、易用,并且面向学生未来发展的软件尤为重要。微软的Power Bi便是不错的选择,其与Office家族息息相关。早在2013年,Office365就已嵌入Bi商业智能解决方案,而今Power Bi早已成长为强大的商业智能分析和数据可视化工具,其官方中国社区的可视化大赛更是进行得如火如荼。该软件另一个巨大好处是低成本,Power Bi Desktop版本是完全免费的,并且具有许多与付费版本相同的功能。
在数据来源这一问题上,学生身边熟悉的数据,或者社会热点数据最为适合。如网络购物数据、家庭消费数据、学习成绩数据等。在此,正值北京地区40天打赢抗“疫”战,以“北京速度”展现中国力量之时,笔者选择引入此次新冠肺炎疫情数据带领学生制作交互型可视化数据报告。目的是使学生保持新鲜感,提升参与度。确定了数据选型,接下来需要找到科学而又权威的数据来源,在基础层面杜绝错误的发生。通过数据搜索,笔者找到了“北京政务数据资源网”(https://data.beijing.gov.cn),在新冠肺炎疫情信息专栏下载了历史数据(图1)。
数据预处理
数据预处理工作主要是在Excel环境下对下载的数据进行整理,删除或添加数据条目。
(1)删除序号。网络上很多数据带有序号索引,而数据分析并不涉及序号数据,所以需要事先删除该条目。
(2)修改数据格式。有时我们下载的数据虽然表面上看是数字,但却是文本格式,需要在Excel中指定为数值型。只有设置成数值格式,才能在Power Bi中自动识别并快速度量。
教学实践过程中,数据预处理环节可以忽略掉繁杂的处理过程,只展示和练习需要注意的重要环节即可。图2为处理后的“北京市6月10日至7月6日新冠肺炎新增数据统计表”的一部分。
PowerBi的安装与注册
首先,前往powerbi.microsoft.com下载桌面版软件,同时该站点还提供了移动端App下载。其次,在注册账户过程中值得一提的是,Power Bi需要用企业邮箱注册,一般的邮箱无法注册成功。学生可以使用钉钉邮箱或者在网络上搜索“临时邮箱”进行快速注册。
制作交互型可视化数据模型
在制作之前,教师应引导学生观察数据各个字段,思考讨论从哪些角度将这些枯燥的数据展示成图形、要用数据表达哪些观点、要用什么样的图形展示最为贴切,最终形成代表性意见。例如,从时间角度上用折线图来展示新增确诊病例数变化过程,用来表达此次北京市防控疫情的迅速果断;从地理空间角度上用柱形图来展示各行政区的确诊病例数对比,用来说明病毒扩散的弱化过程……前期确定数据分析的方向尤为重要,尤其是学生初次接触Power Bi,应以详尽的分析思路引领学生,尽量避开技术问题,转而关注数据的内在价值,为后面的工作做到有的放矢做好准备。同时,选用适当的方法提取、分析和解释数据正是“计算思维”的核心素养。
在Power Bi中点击“获取数据”(图3),可见该软件支持众多导入方式。在此选择Excel格式,并连接到准备好的疫情数据表格。这种连接方式,只要表格中的数据发生变化,Power Bi中即可对视觉对象进行刷新,就像Excel中数据发生变化,以此生成的图表也会自动变化一样。
数据加载成功之后,工作窗口右侧的“字段”界面即可看到每列数据的标题。接下来我们要制作一个简单的折线图,用来从时间维度反映新冠肺炎新增确诊病例数的变化过程。在可视化选项卡界面中选择“折线图”,将“日期”字段拖动到可视化选项卡的“轴”;将“新增病例数”字段拖动到“值”,点击下拉按钮设置度量方式为“求和”(图4)。简单的拖动就做完了“新增确诊病例数”折线图,此外还可以在“可视化”选项卡的“格式”选项,对图表的标题、数据标签、外观等进行详细设置。
继续新建一个堆积柱形图,用来从地理空间维度反映新冠肺炎新增确诊病例的数量对比。拖动“行政区”到“轴”,拖动“新增病例数”到“值”,度量方式依然为“求和”。
两个基础维度的数据分析图构建完毕。接下来,以这两个分析图为依托,继续引领学生将关注问题进行深化细化,如从时间上看疫情暴发的前期以哪些行政区为代表,从空间上看我们所在的大兴区新增确诊病例集中在哪个时间段等。此时引入“切片器”的概念:更细化的筛选数据。在“可视化”选项卡中点击“切片器”,拖动“日期”到“字段”完成构建。滑动滑块可以对整个时间线进行切片分析,清晰看出疫情爆发的前五天(2020年6月10日至6月14日)各行政区的累计确诊数(图5)。同样点击下方柱形图中“大兴区”,也可以看出各时间段的变化趋势。让学生在分析问题的同时体会数据分析的交互性。
为了进一步增强数据的可视化,吸引学生兴趣,我们继续添加“地图”元素,使数据分析界面更友好、更易识别。点击“地图”图标,将“行政区”拖动到“位置”,“新增病例数”拖动到“大小”,并指定度量方式为“求和”。
此时,地图中出现大小不一的气泡,气泡越大代表病例数越多,并且与切片器、柱形图、折线图相互联动,具有很强的交互性。如点击“丰台区”气泡标记,左侧折线图即切换到丰台区新增确诊病例变化数据,下方柱形图也跟随互动,高亮显示丰台区累计确诊病例数量。再结合“切片器”可清晰快速地得出很多结论。例如,疫情后期6月26日至7月6日仅有两个行政区有新增确诊病例;丰台区此阶段累计新增43人确诊;丰台区26日至30日疫情形势出现积极变化,新增确诊病例降幅明显。
挖掘数据价值
通过正确而规范的数据、适合的数字化工具、适当的分析方法,我们构建了交互型可视化的数据分析模型。接下來,需要引导学生挖掘数据中隐藏的信息,体会这些有价值的信息对形成正确决策的作用和意义,认识数据管理与分析技术对人类社会生活的重要影响。而这正是提升“信息意识”核心素养的关键一步。
此时,可以让学生根据上面已经做好的数据分析模型,针对此阶段北京市的疫情撰写简单的分析报告,发表各自观点。其目的除了使学生认识到数据的重要性,还可以让学生逆向体会数据分析的构建思路,做到先拆解数据模型厘清脉络,再组合思路,思考对现行分析方法的优化和改进。最后提出新的数据分析任务,给学生布置选题,既可以自由选题独立获取数据,也可以由教师提供诸如学校图书馆借阅数据、学生视力数据、体质健康测试数据供学生选择。重点让学生自己确立分析思路、制作数据模型、撰写并展示分析报告,亲身体会数据分析的整个项目过程。
以上是我们对信息技术教学中数据分析内容的技术实现和学习策略探究。如今,多样的数据分析技术已经广泛应用于人们的日常生活和学习中,越来越成为解决实际问题的重要方式。同时,我们在体会大数据、可视化、智能分析带来巨大便利的同时,也应深切思考如何带领学生掠过光鲜飞奔的技术列车,转而关注如铁轨一般行稳致远的根本素养。
作者单位:北京市大兴区第一中学
【关键词】数据分析;可视化;大数据;Power Bi
【中图分类号】434 【文献标识码】B
【论文编号】1671-7384(2020)011-076-04
2017版普通高中信息技术课程标准中强调:“构建具有时代特征的学习内容,将知识构建、技能培养与思维发展融入运用数字化工具解决问题和完成任务的过程中。”而数据作为信息时代的基石以及一切数字化工具的根本资源,越来越受到大家的重视。让学生了解和体会数据分析和可视化表达更是必修模块中的重要环节。
日常生活中的“数据”和“枯燥”一词形影不离,大数据更是远看光鲜亮丽,近看无从下手。如何打破僵化局面,带给学生易于实现且富有视觉冲击的数据分析课程,是我们每位信息技术教师关心的问题。但是,无论是Excel视觉图表,还是Python词云展示,似乎都略显单薄,无法引领学生一窥大数据的风采。本文将从技术实现过程和教学策略角度阐述数据分析课程的探索与尝试。
工具选择和数据来源
工欲善其事,必先利其器。选用适合的数字化工具进行协作学习和解决问题正是在培养学生“数字化学习与创新”核心素养。一款上手简单、易用,并且面向学生未来发展的软件尤为重要。微软的Power Bi便是不错的选择,其与Office家族息息相关。早在2013年,Office365就已嵌入Bi商业智能解决方案,而今Power Bi早已成长为强大的商业智能分析和数据可视化工具,其官方中国社区的可视化大赛更是进行得如火如荼。该软件另一个巨大好处是低成本,Power Bi Desktop版本是完全免费的,并且具有许多与付费版本相同的功能。
在数据来源这一问题上,学生身边熟悉的数据,或者社会热点数据最为适合。如网络购物数据、家庭消费数据、学习成绩数据等。在此,正值北京地区40天打赢抗“疫”战,以“北京速度”展现中国力量之时,笔者选择引入此次新冠肺炎疫情数据带领学生制作交互型可视化数据报告。目的是使学生保持新鲜感,提升参与度。确定了数据选型,接下来需要找到科学而又权威的数据来源,在基础层面杜绝错误的发生。通过数据搜索,笔者找到了“北京政务数据资源网”(https://data.beijing.gov.cn),在新冠肺炎疫情信息专栏下载了历史数据(图1)。
数据预处理
数据预处理工作主要是在Excel环境下对下载的数据进行整理,删除或添加数据条目。
(1)删除序号。网络上很多数据带有序号索引,而数据分析并不涉及序号数据,所以需要事先删除该条目。
(2)修改数据格式。有时我们下载的数据虽然表面上看是数字,但却是文本格式,需要在Excel中指定为数值型。只有设置成数值格式,才能在Power Bi中自动识别并快速度量。
教学实践过程中,数据预处理环节可以忽略掉繁杂的处理过程,只展示和练习需要注意的重要环节即可。图2为处理后的“北京市6月10日至7月6日新冠肺炎新增数据统计表”的一部分。
PowerBi的安装与注册
首先,前往powerbi.microsoft.com下载桌面版软件,同时该站点还提供了移动端App下载。其次,在注册账户过程中值得一提的是,Power Bi需要用企业邮箱注册,一般的邮箱无法注册成功。学生可以使用钉钉邮箱或者在网络上搜索“临时邮箱”进行快速注册。
制作交互型可视化数据模型
在制作之前,教师应引导学生观察数据各个字段,思考讨论从哪些角度将这些枯燥的数据展示成图形、要用数据表达哪些观点、要用什么样的图形展示最为贴切,最终形成代表性意见。例如,从时间角度上用折线图来展示新增确诊病例数变化过程,用来表达此次北京市防控疫情的迅速果断;从地理空间角度上用柱形图来展示各行政区的确诊病例数对比,用来说明病毒扩散的弱化过程……前期确定数据分析的方向尤为重要,尤其是学生初次接触Power Bi,应以详尽的分析思路引领学生,尽量避开技术问题,转而关注数据的内在价值,为后面的工作做到有的放矢做好准备。同时,选用适当的方法提取、分析和解释数据正是“计算思维”的核心素养。
在Power Bi中点击“获取数据”(图3),可见该软件支持众多导入方式。在此选择Excel格式,并连接到准备好的疫情数据表格。这种连接方式,只要表格中的数据发生变化,Power Bi中即可对视觉对象进行刷新,就像Excel中数据发生变化,以此生成的图表也会自动变化一样。
数据加载成功之后,工作窗口右侧的“字段”界面即可看到每列数据的标题。接下来我们要制作一个简单的折线图,用来从时间维度反映新冠肺炎新增确诊病例数的变化过程。在可视化选项卡界面中选择“折线图”,将“日期”字段拖动到可视化选项卡的“轴”;将“新增病例数”字段拖动到“值”,点击下拉按钮设置度量方式为“求和”(图4)。简单的拖动就做完了“新增确诊病例数”折线图,此外还可以在“可视化”选项卡的“格式”选项,对图表的标题、数据标签、外观等进行详细设置。
继续新建一个堆积柱形图,用来从地理空间维度反映新冠肺炎新增确诊病例的数量对比。拖动“行政区”到“轴”,拖动“新增病例数”到“值”,度量方式依然为“求和”。
两个基础维度的数据分析图构建完毕。接下来,以这两个分析图为依托,继续引领学生将关注问题进行深化细化,如从时间上看疫情暴发的前期以哪些行政区为代表,从空间上看我们所在的大兴区新增确诊病例集中在哪个时间段等。此时引入“切片器”的概念:更细化的筛选数据。在“可视化”选项卡中点击“切片器”,拖动“日期”到“字段”完成构建。滑动滑块可以对整个时间线进行切片分析,清晰看出疫情爆发的前五天(2020年6月10日至6月14日)各行政区的累计确诊数(图5)。同样点击下方柱形图中“大兴区”,也可以看出各时间段的变化趋势。让学生在分析问题的同时体会数据分析的交互性。
为了进一步增强数据的可视化,吸引学生兴趣,我们继续添加“地图”元素,使数据分析界面更友好、更易识别。点击“地图”图标,将“行政区”拖动到“位置”,“新增病例数”拖动到“大小”,并指定度量方式为“求和”。
此时,地图中出现大小不一的气泡,气泡越大代表病例数越多,并且与切片器、柱形图、折线图相互联动,具有很强的交互性。如点击“丰台区”气泡标记,左侧折线图即切换到丰台区新增确诊病例变化数据,下方柱形图也跟随互动,高亮显示丰台区累计确诊病例数量。再结合“切片器”可清晰快速地得出很多结论。例如,疫情后期6月26日至7月6日仅有两个行政区有新增确诊病例;丰台区此阶段累计新增43人确诊;丰台区26日至30日疫情形势出现积极变化,新增确诊病例降幅明显。
挖掘数据价值
通过正确而规范的数据、适合的数字化工具、适当的分析方法,我们构建了交互型可视化的数据分析模型。接下來,需要引导学生挖掘数据中隐藏的信息,体会这些有价值的信息对形成正确决策的作用和意义,认识数据管理与分析技术对人类社会生活的重要影响。而这正是提升“信息意识”核心素养的关键一步。
此时,可以让学生根据上面已经做好的数据分析模型,针对此阶段北京市的疫情撰写简单的分析报告,发表各自观点。其目的除了使学生认识到数据的重要性,还可以让学生逆向体会数据分析的构建思路,做到先拆解数据模型厘清脉络,再组合思路,思考对现行分析方法的优化和改进。最后提出新的数据分析任务,给学生布置选题,既可以自由选题独立获取数据,也可以由教师提供诸如学校图书馆借阅数据、学生视力数据、体质健康测试数据供学生选择。重点让学生自己确立分析思路、制作数据模型、撰写并展示分析报告,亲身体会数据分析的整个项目过程。
以上是我们对信息技术教学中数据分析内容的技术实现和学习策略探究。如今,多样的数据分析技术已经广泛应用于人们的日常生活和学习中,越来越成为解决实际问题的重要方式。同时,我们在体会大数据、可视化、智能分析带来巨大便利的同时,也应深切思考如何带领学生掠过光鲜飞奔的技术列车,转而关注如铁轨一般行稳致远的根本素养。
作者单位:北京市大兴区第一中学