论文部分内容阅读
摘要:从培养学生的大数据分析与处理能力出发,结合学生的学情,对面向统计学专业学生开设的大数据分析与处理课程进行规划与设计,给出了课程规划思路、教学内容安排以及考核与评价的方式。
关键词:大数据分析与处理;课程规划;Python;课程教学
中图分类号:G642 文献标识码:A
文章编号:1009-3044(2020)10-0098-02
1大数据背景
大数据时代已经到来,在商业、经济及其他领域中基于数据和分析去发现问题并做出科学、客观的决策越来越重要。大数据从各领域的专业角度来看,大致可以从两个方面来理解:一是大数据体现在数据的量、类型及产生速度上,不仅数据海量,还包含着各种半结构化数据和非结构化数据;二是在数据处理流程中,利用常规的统计软件已经无法对当今的数据进行及时有效的存储、分析及运用嘲。在数据的搜集上,相对于传统的普查及抽样等调查取得一手数据和通过非调查手段获得的二手数据,大数据时代的来临使数据搜集方式变为在线互联网数据库获取的二手数据;在数据分析上,统计学方法采取的是对样本数据的有目的的建模,而大数据分析技术则是通过云计算平台,对大数据进行挖掘。此外,大数据分析技术将帮助企业用户在合理时间内获取、管理、处理以及整理海量数据,为企业经营决策提供积极的帮助,而数据分析作为一门前沿技术,广泛应用于物联网、云计算、移动互联网等战略新兴产业。有实践经验的数据分析人才已经成了各企業争夺的热门,而与此发展趋势不相协调的则是高校相关专业毕业生在大数据方向上基础薄弱,真正掌握大数据管理、分析和产品研发等相关技术的人才极度匮乏。为了推动我国大数据的发展,满足日益增长的数据分析人才需求,我校特面向统计学专业学生开设大数据分析与处理课程。
2课程规划与设计
2.1培养对象和目标
对于统计学专业学生来说,要想成为一个兼具统计学专业知识和大数据分析技能的合格人才,需要具备以下基础:一是完整的数学和统计学知识体系,以专业理论知识为基础,理解处理数据时采用的相关模型;二是具备搜集数据的能力,包括传统的抽样调查和从互联网上抓取数据;三是具有计算编程的能力,以实现Hadoop、Hive等计算工具在大规模多源异构数据上的处理,特别地,应该掌握最兼容的脚本语言Python。通过大数据分析与处理课程的学习,使统计学专业学生不仅能利用Python进行科学计算、可视化绘图、数据预处理,还能利用聚类、回归、分类等算法对实际问题进行分析与建模,将理论知识与实践运用相结合,为将来从事数据分析和挖掘研究工作奠定基础。
2.2课程规划思路
本课程的规划主要拟从以下几个方面展开:一是结合统计学专业学生的基础,考虑其对课程的接受程度,选择和安排合适的课程教学内容和教学方式。在课堂教学过程中,深入浅出地讲解理论知识,特别地,要避免课堂上枯燥乏味的数学论证,同时需结合实例交叉进行,以激发学生学习与探索的兴趣。二是将理论与实践相结合,合理分配理论学时与实验学时。配合课程的理论知识与实例,安排学生进行上机实验,利用Python实现相关实例的操作与验证。三是补充练习与案例讨论部分,并在课程结束时安排课程设计环节。除了教材内的案例,适当补充当前生活中出现的具有代表性新案例,与时俱进;也可将学生进行分组,每个小组选择一个感兴趣的新案例进行深入分析与探讨,以强化学生综合运用知识、融会贯通的能力。
2.3课程教学内容安排
本课程拟采用黄红梅和张良均编写的教材《Python数据分析与应用》。在教学过程中,将采用理论与实践相结合的教学方法,侧重于培养学生的动手分析能力,因此,在总共40学时的课程学习中,安排理论课时16课时,实验课时24课时。在理论学习中,通过任务引入概念、原理和方法;在实验上机练习中,充分地利用现有的硬件资源和网络资源,发挥学生的主观能动性,指导学生使用NumPy进行科学计算,利用matplotlib进行基础图形绘制以实现数据可视化,使用pandas进行统计分析和数据预处理,使用sklearn进行建模,同时结合三个典型的综合案例,引导学生将所学知识与企业需求相结合,将知识活学活用。课程学时分配如表1所示,具体的理论教学内容如表2所示。
2.4教学效果评价与考核方式
对统计学专业学生来说,大数据分析与处理这门课程侧重于培养学生解决实际问题的能力,而教学效果体现在学生平时上机实验与课程设计中的动手操作能力,因此,该课程的考核方式设置为考查,学生的成绩由平时实验作业、课堂出勤以及课程设计三部分构成,占比为4:2:4。
3结论
本文对面向统计学专业学生开设的大数据分析与处理课程进行教学规划与设计,结合学生的学情与基础,在有限的课时内合理安排理论教学内容与实验教学内容,通过理论与实践相结合的方式,使学生既能理解大数据分析与处理的原理与方法,又能掌握分析和解决实际问题的能力。
关键词:大数据分析与处理;课程规划;Python;课程教学
中图分类号:G642 文献标识码:A
文章编号:1009-3044(2020)10-0098-02
1大数据背景
大数据时代已经到来,在商业、经济及其他领域中基于数据和分析去发现问题并做出科学、客观的决策越来越重要。大数据从各领域的专业角度来看,大致可以从两个方面来理解:一是大数据体现在数据的量、类型及产生速度上,不仅数据海量,还包含着各种半结构化数据和非结构化数据;二是在数据处理流程中,利用常规的统计软件已经无法对当今的数据进行及时有效的存储、分析及运用嘲。在数据的搜集上,相对于传统的普查及抽样等调查取得一手数据和通过非调查手段获得的二手数据,大数据时代的来临使数据搜集方式变为在线互联网数据库获取的二手数据;在数据分析上,统计学方法采取的是对样本数据的有目的的建模,而大数据分析技术则是通过云计算平台,对大数据进行挖掘。此外,大数据分析技术将帮助企业用户在合理时间内获取、管理、处理以及整理海量数据,为企业经营决策提供积极的帮助,而数据分析作为一门前沿技术,广泛应用于物联网、云计算、移动互联网等战略新兴产业。有实践经验的数据分析人才已经成了各企業争夺的热门,而与此发展趋势不相协调的则是高校相关专业毕业生在大数据方向上基础薄弱,真正掌握大数据管理、分析和产品研发等相关技术的人才极度匮乏。为了推动我国大数据的发展,满足日益增长的数据分析人才需求,我校特面向统计学专业学生开设大数据分析与处理课程。
2课程规划与设计
2.1培养对象和目标
对于统计学专业学生来说,要想成为一个兼具统计学专业知识和大数据分析技能的合格人才,需要具备以下基础:一是完整的数学和统计学知识体系,以专业理论知识为基础,理解处理数据时采用的相关模型;二是具备搜集数据的能力,包括传统的抽样调查和从互联网上抓取数据;三是具有计算编程的能力,以实现Hadoop、Hive等计算工具在大规模多源异构数据上的处理,特别地,应该掌握最兼容的脚本语言Python。通过大数据分析与处理课程的学习,使统计学专业学生不仅能利用Python进行科学计算、可视化绘图、数据预处理,还能利用聚类、回归、分类等算法对实际问题进行分析与建模,将理论知识与实践运用相结合,为将来从事数据分析和挖掘研究工作奠定基础。
2.2课程规划思路
本课程的规划主要拟从以下几个方面展开:一是结合统计学专业学生的基础,考虑其对课程的接受程度,选择和安排合适的课程教学内容和教学方式。在课堂教学过程中,深入浅出地讲解理论知识,特别地,要避免课堂上枯燥乏味的数学论证,同时需结合实例交叉进行,以激发学生学习与探索的兴趣。二是将理论与实践相结合,合理分配理论学时与实验学时。配合课程的理论知识与实例,安排学生进行上机实验,利用Python实现相关实例的操作与验证。三是补充练习与案例讨论部分,并在课程结束时安排课程设计环节。除了教材内的案例,适当补充当前生活中出现的具有代表性新案例,与时俱进;也可将学生进行分组,每个小组选择一个感兴趣的新案例进行深入分析与探讨,以强化学生综合运用知识、融会贯通的能力。
2.3课程教学内容安排
本课程拟采用黄红梅和张良均编写的教材《Python数据分析与应用》。在教学过程中,将采用理论与实践相结合的教学方法,侧重于培养学生的动手分析能力,因此,在总共40学时的课程学习中,安排理论课时16课时,实验课时24课时。在理论学习中,通过任务引入概念、原理和方法;在实验上机练习中,充分地利用现有的硬件资源和网络资源,发挥学生的主观能动性,指导学生使用NumPy进行科学计算,利用matplotlib进行基础图形绘制以实现数据可视化,使用pandas进行统计分析和数据预处理,使用sklearn进行建模,同时结合三个典型的综合案例,引导学生将所学知识与企业需求相结合,将知识活学活用。课程学时分配如表1所示,具体的理论教学内容如表2所示。
2.4教学效果评价与考核方式
对统计学专业学生来说,大数据分析与处理这门课程侧重于培养学生解决实际问题的能力,而教学效果体现在学生平时上机实验与课程设计中的动手操作能力,因此,该课程的考核方式设置为考查,学生的成绩由平时实验作业、课堂出勤以及课程设计三部分构成,占比为4:2:4。
3结论
本文对面向统计学专业学生开设的大数据分析与处理课程进行教学规划与设计,结合学生的学情与基础,在有限的课时内合理安排理论教学内容与实验教学内容,通过理论与实践相结合的方式,使学生既能理解大数据分析与处理的原理与方法,又能掌握分析和解决实际问题的能力。