论文部分内容阅读
摘 要:学生学习兴趣直接影响学生的学习质量。如果能准确了解学生学习兴趣,对于提高学生学习积极性、学校教育质量有着重要意义。随着高校校园信息化,校园内数据倍增,将数据用于进一步挖掘分析,对于校园、教育管理具有非常重要的作用。其中,对大学生在校园内的各种行为所产生的数据进行采集、预处理、分析、挖掘,多维度挖掘学生学习兴趣,一方面可以使得学生更加全面了解自己,学校施展教育更有针对性;另一方面,学生可以根据自己兴趣为日后职业规划做准备。
关键词:校园数据;大数据技术;学习兴趣;数据分析
中图分类号:TP311.13;TP391.1 文献标识码:A 文章编号:2096-4706(2020)07-0175-03
Analysis and Application of Students’Learning Interest Based on Big Data of Campus
——Taking Guangdong Mechanical and Electrical Polytechnic as an Example
ZHENG Qianru,ZOU Caifeng
(Guangdong Mechanical and Electrical Polytechnic,Guangzhou 510550,China)
Abstract:Learning interest of students determines the learning quality. If learning interest of students can be achieved accurately,it may help to improve the students’learning initiative and school’s education quality. As informatization of colleges develops,school data grows up. To analysis the school data may be helpful for the school and education management. More specifically,collecting,preprocessing,analysis,mining the school data to find the learning interests of students in multidimensions,on the one hand,it can makes the students know themselves more comprehensively and teachers give a targeted teaching on one hand,on the other hand helps the students make preparation for career based on their study interests.
Keywords:school data;big data technology;learning interests;data analysis
0 引 言
隨着校园信息化、智慧校园建设,校园内产生数据越来越多。利用大数据技术对这些数据进行分析,可以挖掘学生的学习兴趣。对于学校来说,掌握学生学习兴趣,对教师因材施教有着重要作用,同时,教师可以根据学生学习兴趣对学生未来就业提供有针对性的建议。对于学生来说,了解自身学习兴趣,可以对未来就业规划有着重要指导作用。
1 校园数据价值与教育数据挖掘
1.1 校园数据价值
自2012年,我国开展教育信息化,推进各个高校实现智慧校园建设、信息化教育模式应用、教育资源共享等服务[1]。以广东机电职业技术学院为例,校园内部有各个子系统,如财务系统、行政系统、教学系统、学生信息、科研信息和后勤管理等,这些子系统都产生大量的数据[2]。这些数据体量较大,但是利用率不高。
在教育领域,“因材施教”一直是教育难点[3],老师很难准确把握每个学生的兴趣特长,而学生也因为认知水平、学习经验、学习能力、学习习惯等原因而捕捉不到自己的真实兴趣。如果能将教育相关的数据收集起来,并加以分析和挖掘学生兴趣,将会对提高教学质量和学生学习积极性有促进作用。
1.2 教育数据挖掘
教育数据挖掘是数据挖掘技术在教育领域的应用和发展[4],以便相关人员利用挖掘出来的信息更好地为教育教学服务[5]。在外国,已有国家开展教育数据挖掘(Educational Data Mining),并认为数据质量直接决定挖掘信息的质量[6]。例如,2012年,美国教育部发布的《通过教育数据挖掘和学习分析促进教与学》中指出,美国高等院校教学系统变革,要通过对教育大数据挖掘与分析来实现[7];2015年,美国国家教育统计中心(NCES)认为面向学校和学区的教育数据非常重要,可以对教育质量产生影响[8]。
在国内,教育数据挖掘技术已经在多方面进行应用,如提高教育管理效率[9]、分析和引导学生消费模型[10]、大学生孤独预警模型[11]等。利用校园数据挖掘学生学习兴趣的研究相对较少,因此,本文围绕该方向进行进一步探究。
2 校园大数据的学生学习兴趣分析与应用
2.1 学生学习兴趣分析平台
基于校内各个管理系统数据实现分析学生学习兴趣的系统可以采用基于Hadoop的分布式系统框架,如图1所示。Hadoop集成了HBase、Hive、Sqoop、ZooKeeper等组件。离线的传统关系型数据(如选课数据、成绩数据、出勤数据、图书借阅数据),可以采用Sqoop组件同步到Hadoop集群中的分布式文件系统(Hadoop Distributed File System,HDFS)。动态采集的实时数据(上网访问数据)可以采用日志采集组件Flume、实时处理组件Spark或者Storm来采集。采集好的数据,通过进一步的清洗,可以采用Hive、Spark等数据分析工具来进行相关统计分析。分析后的结果可以存入HBase、Redis、Elasticsearch等能快速检索的数据库,方便呈现学生学习兴趣挖掘结果。 2.2 校园数据采集与预处理
校园内部各个子系统,如财务系统、行政系统、教学系统、学生信息、科研信息和后勤管理等都会产生大量的数据。采集与学生学习兴趣相关的部分数据采集回来做进一步分析,包括:选课数据、成绩数据、出勤数据、图书借阅数据和网上访问内容偏好数据,采集方法如下:
(1)选课数据。选课系统记录了每个学生的选课记录,可以通过访问选课系统的数据库获得每个学生的选课时间、所选课程、所选课程科目。
(2)成绩数据。教务系统或者成绩系统记录每个学生每门课程的考核成绩,可以通过访问其数据库获得学生每门课程的成绩。
(3)出勤数据。出勤数据分为在线获取和人工获取两种方式。在线获取是指使用在线签到方式来记录学生的考勤,人工获取则是通过学生或教师记录出勤数据。以广东机电职业技术学院为例,每个班级上课的出勤数据由所在班级的副班长人工统计,数据可以向教务处申请采集并进行数字化处理。
(4)图书借阅数据。图书馆管理系统会记录每个学生的借书还书记录,可以通过访问其数据库而获得每个学生借阅的书本时长、借阅书本所属类别。
(5)网上访问内容偏好数据。可以通过设定程序,采集校园网服务器中的流量数据,如访问时间、访问地址、访问频率和访问内容。以广东机电职业技术学院为例,每个学生上网的IP是固定IP,因此可以将互联网浏览数据根据IP进行分类,从而对每个学生互联网浏览内容喜好进行分析。
广东机电职业技术学院共有10个独立学院、44个专业,全日制学生达到15 000多人。由于学生数量多,所产生的数据众多,不可避免地会出现干扰数据、无效数据和缺失数据。数据预处理需要对采集回来的数据进行清洗和筛选,避免这些不良数据影响数据挖掘的质量。并且将学生ID相同的数据归为一类。
2.3 学生兴趣分析与挖掘
对预处理好的数据进行以下四个方面的学生学习兴趣数据分析:
(1)专业课学习兴趣,通过计算专业课程出勤率和专业课程成绩排名来评价。如果一个学生专业课程出勤率高、专业课程成绩排名靠前,说明该学生对所在专业课程非常感兴趣。
(2)选修课学习兴趣,通过计算学生选修课程出勤率、选修课程成绩排名、选修课程科目统计来评价。如果一个学生选修课科目集中在某个学科、出勤率高、选修课程成绩排名靠前,说明该学生对该学科知识非常感兴趣。
(3)课外书籍阅读兴趣,通过统计学生借阅图书次数、借阅图书类别统计、借阅图书时长来评价。如果一个学生经常借阅某个类别的图书,或者借阅某个类别的图书时间很长,说明该学生对该类别图书非常感兴趣。
(4)上网访问内容兴趣,可以通过统计访问内容偏好统计、访问时长来评价。如果一个学生经常访问某个类型的网站,或者访问时间比较长,说明该学生对这个类型的资讯非常感兴趣。
2.4 学生兴趣数据应用
通过学习兴趣的分析结果,学生对自身的学习兴趣爱好有了更深入的了解,可以对当下学习内容、学习习惯、学习方法进行调整,以便达到更好的学习效果,同时也为未来就业选择做好准备;老师可以针对学生学习兴趣爱好给予更个性化、更有针对性的指导,做到因材施教,提高学生学习效率;学校可以通过积累历年学生学习兴趣数据来制定教学方案,以便提高教育质量。
2.5 学生兴趣结果可视化
分析挖掘后的结果可以通过校园网Web形式、手机APP、企业微信等形式进行可视化,方便学生个人的查询和指导老师的访问。比如图2,软件工程的学生张三,专业课程排名较高,出勤率较高,说明张三对软件工程专业的兴趣度较高;张三选修次数最多科目是经济学,选修课的成绩较高,说明张三除了软件工程之外,他对经济学的内容也比较感兴趣。平时上网访问的内容集中在金融资讯。因此老师可以鼓励张三多学习经济、金融的知识,未来就业也可以多关注金融、互联网金融等方面的公司职位。
3 学生学习兴趣分析存在的困难和挑战
利用校园数据挖掘学生学习兴趣对学生个人和学校本身都具有积极性影响,尽管如此,使用校园数据挖掘学生学习兴趣,仍然有一些不能忽视的困难和挑战。
3.1 大数据平台构建的积极性
随着教育信息化的发展,校园办公、教学等电子系统得到广泛使用。在大多数高校中,大数据平台除了为学生开展课程、参与相关比赛而搭建,并没有在全校园内进行广泛使用。要大数据技术在校园内得到有效应用,需要学校给予足够重视,并且积极构建大数据平台。
3.2 打破各部门数据壁垒
校园数据涉及学校众多部门,每个部门有各自的管理系统,这使得各部门管理运作相对独立,但是同时带来数据难以共享等问题。利用大数据可以在技术层面上打破部门数据壁垒,使得各个部门数据统一采集到大数据平台。但仍然需要学校领导积极协调各个部门,才能使工作名正言顺地开展。
3.3 确保数据安全性
数据安全是数据挖掘分析的重要挑战。当发生学生隐私数据泄露事件,将会对学生产生负面影响,同时也会对学校形象产生不可估量的消极影响。对采集数据进行私隐分类,对于涉及学生隐私的数据,在采集之前要进行询问,征得同意后方可采集。要建立完善的数据保密机制,规范化使用数据流程,防止数据泄露。建立在合法、安全、保护学生隐私的基础上,数据挖掘分析才有意义。
4 结 论
随着校园信息化推进、大数据技术发展,利用大数据技术挖掘校园数据成为教育数据挖掘领域其中一个重要分支。其挖掘结果可以应用到教育、管理、学生行为预警等方面。利用校园数据挖掘学生学习兴趣不仅可以帮助学生深入了解自己,并且帮助学校和老师更有针对性地指导学生,达到双赢效果。
参考文献:
[1] 杨龙.基于大数据和人工智能的高校信息化服务研究 [J].实验技术与管理,2018,35(11):153-156.
[2] 杨天敏.大数据时代下的高校智慧校园建设探究 [J].计算机时代,2019(9):107-109.
[3] 徐焱.基于教育数据挖掘的个性化自适应学习系统研究 [J].中国教育信息化,2019(11):60-65.
[4] 雷晓锋,杨明.教育数据挖掘的研究进展与趋势 [J].北京航空航天大学学报(社会科学版),2018,31(4):108-114.
[5] 曹慧娟,王晓春,刘彦蓉.国内教育数据挖掘文献的知识图谱分析 [J].中国教育信息化,2019(17):5-8.
[6] 丁国勇,程晋宽.高校學生学业表现研究:历史回顾、现实问题与未来路向 [J].黑龙江高教研究,2019,37(10):52-56.
[7] 王正青,但金凤.大数据时代美国教育数据质量管理流程与保障 [J].现代远程教育研究,2019,31(5):96-103+112.
[8] 胡刃锋,李瑶.教育大数据研究热点探析 [J].延边教育学院学报,2018,32(2):58-60+63.
[9] 张宁.学习分析:大数据时代高等教育变革的重要动力 [J].中国成人教育,2018(20):17-19.
[10] 王军,孙蓓.基于大数据的高职学生行为分析与平台研究 [J].现代信息科技,2019,3(8):13-15.
[11] 余琳,许婷,李超,等.大数据背景下的学生孤独预警模型——以华中师范大学为例 [J].现代信息科技,2019,3(23):1-4.
作者简介:郑倩如(1985—),女,汉族,广东广州人,讲师,博士,研究方向:数据挖掘,大数据;邹才凤(1980—),女,汉族,广东广州人,副教授,博士,研究方向:数据挖掘,大数据。
关键词:校园数据;大数据技术;学习兴趣;数据分析
中图分类号:TP311.13;TP391.1 文献标识码:A 文章编号:2096-4706(2020)07-0175-03
Analysis and Application of Students’Learning Interest Based on Big Data of Campus
——Taking Guangdong Mechanical and Electrical Polytechnic as an Example
ZHENG Qianru,ZOU Caifeng
(Guangdong Mechanical and Electrical Polytechnic,Guangzhou 510550,China)
Abstract:Learning interest of students determines the learning quality. If learning interest of students can be achieved accurately,it may help to improve the students’learning initiative and school’s education quality. As informatization of colleges develops,school data grows up. To analysis the school data may be helpful for the school and education management. More specifically,collecting,preprocessing,analysis,mining the school data to find the learning interests of students in multidimensions,on the one hand,it can makes the students know themselves more comprehensively and teachers give a targeted teaching on one hand,on the other hand helps the students make preparation for career based on their study interests.
Keywords:school data;big data technology;learning interests;data analysis
0 引 言
隨着校园信息化、智慧校园建设,校园内产生数据越来越多。利用大数据技术对这些数据进行分析,可以挖掘学生的学习兴趣。对于学校来说,掌握学生学习兴趣,对教师因材施教有着重要作用,同时,教师可以根据学生学习兴趣对学生未来就业提供有针对性的建议。对于学生来说,了解自身学习兴趣,可以对未来就业规划有着重要指导作用。
1 校园数据价值与教育数据挖掘
1.1 校园数据价值
自2012年,我国开展教育信息化,推进各个高校实现智慧校园建设、信息化教育模式应用、教育资源共享等服务[1]。以广东机电职业技术学院为例,校园内部有各个子系统,如财务系统、行政系统、教学系统、学生信息、科研信息和后勤管理等,这些子系统都产生大量的数据[2]。这些数据体量较大,但是利用率不高。
在教育领域,“因材施教”一直是教育难点[3],老师很难准确把握每个学生的兴趣特长,而学生也因为认知水平、学习经验、学习能力、学习习惯等原因而捕捉不到自己的真实兴趣。如果能将教育相关的数据收集起来,并加以分析和挖掘学生兴趣,将会对提高教学质量和学生学习积极性有促进作用。
1.2 教育数据挖掘
教育数据挖掘是数据挖掘技术在教育领域的应用和发展[4],以便相关人员利用挖掘出来的信息更好地为教育教学服务[5]。在外国,已有国家开展教育数据挖掘(Educational Data Mining),并认为数据质量直接决定挖掘信息的质量[6]。例如,2012年,美国教育部发布的《通过教育数据挖掘和学习分析促进教与学》中指出,美国高等院校教学系统变革,要通过对教育大数据挖掘与分析来实现[7];2015年,美国国家教育统计中心(NCES)认为面向学校和学区的教育数据非常重要,可以对教育质量产生影响[8]。
在国内,教育数据挖掘技术已经在多方面进行应用,如提高教育管理效率[9]、分析和引导学生消费模型[10]、大学生孤独预警模型[11]等。利用校园数据挖掘学生学习兴趣的研究相对较少,因此,本文围绕该方向进行进一步探究。
2 校园大数据的学生学习兴趣分析与应用
2.1 学生学习兴趣分析平台
基于校内各个管理系统数据实现分析学生学习兴趣的系统可以采用基于Hadoop的分布式系统框架,如图1所示。Hadoop集成了HBase、Hive、Sqoop、ZooKeeper等组件。离线的传统关系型数据(如选课数据、成绩数据、出勤数据、图书借阅数据),可以采用Sqoop组件同步到Hadoop集群中的分布式文件系统(Hadoop Distributed File System,HDFS)。动态采集的实时数据(上网访问数据)可以采用日志采集组件Flume、实时处理组件Spark或者Storm来采集。采集好的数据,通过进一步的清洗,可以采用Hive、Spark等数据分析工具来进行相关统计分析。分析后的结果可以存入HBase、Redis、Elasticsearch等能快速检索的数据库,方便呈现学生学习兴趣挖掘结果。 2.2 校园数据采集与预处理
校园内部各个子系统,如财务系统、行政系统、教学系统、学生信息、科研信息和后勤管理等都会产生大量的数据。采集与学生学习兴趣相关的部分数据采集回来做进一步分析,包括:选课数据、成绩数据、出勤数据、图书借阅数据和网上访问内容偏好数据,采集方法如下:
(1)选课数据。选课系统记录了每个学生的选课记录,可以通过访问选课系统的数据库获得每个学生的选课时间、所选课程、所选课程科目。
(2)成绩数据。教务系统或者成绩系统记录每个学生每门课程的考核成绩,可以通过访问其数据库获得学生每门课程的成绩。
(3)出勤数据。出勤数据分为在线获取和人工获取两种方式。在线获取是指使用在线签到方式来记录学生的考勤,人工获取则是通过学生或教师记录出勤数据。以广东机电职业技术学院为例,每个班级上课的出勤数据由所在班级的副班长人工统计,数据可以向教务处申请采集并进行数字化处理。
(4)图书借阅数据。图书馆管理系统会记录每个学生的借书还书记录,可以通过访问其数据库而获得每个学生借阅的书本时长、借阅书本所属类别。
(5)网上访问内容偏好数据。可以通过设定程序,采集校园网服务器中的流量数据,如访问时间、访问地址、访问频率和访问内容。以广东机电职业技术学院为例,每个学生上网的IP是固定IP,因此可以将互联网浏览数据根据IP进行分类,从而对每个学生互联网浏览内容喜好进行分析。
广东机电职业技术学院共有10个独立学院、44个专业,全日制学生达到15 000多人。由于学生数量多,所产生的数据众多,不可避免地会出现干扰数据、无效数据和缺失数据。数据预处理需要对采集回来的数据进行清洗和筛选,避免这些不良数据影响数据挖掘的质量。并且将学生ID相同的数据归为一类。
2.3 学生兴趣分析与挖掘
对预处理好的数据进行以下四个方面的学生学习兴趣数据分析:
(1)专业课学习兴趣,通过计算专业课程出勤率和专业课程成绩排名来评价。如果一个学生专业课程出勤率高、专业课程成绩排名靠前,说明该学生对所在专业课程非常感兴趣。
(2)选修课学习兴趣,通过计算学生选修课程出勤率、选修课程成绩排名、选修课程科目统计来评价。如果一个学生选修课科目集中在某个学科、出勤率高、选修课程成绩排名靠前,说明该学生对该学科知识非常感兴趣。
(3)课外书籍阅读兴趣,通过统计学生借阅图书次数、借阅图书类别统计、借阅图书时长来评价。如果一个学生经常借阅某个类别的图书,或者借阅某个类别的图书时间很长,说明该学生对该类别图书非常感兴趣。
(4)上网访问内容兴趣,可以通过统计访问内容偏好统计、访问时长来评价。如果一个学生经常访问某个类型的网站,或者访问时间比较长,说明该学生对这个类型的资讯非常感兴趣。
2.4 学生兴趣数据应用
通过学习兴趣的分析结果,学生对自身的学习兴趣爱好有了更深入的了解,可以对当下学习内容、学习习惯、学习方法进行调整,以便达到更好的学习效果,同时也为未来就业选择做好准备;老师可以针对学生学习兴趣爱好给予更个性化、更有针对性的指导,做到因材施教,提高学生学习效率;学校可以通过积累历年学生学习兴趣数据来制定教学方案,以便提高教育质量。
2.5 学生兴趣结果可视化
分析挖掘后的结果可以通过校园网Web形式、手机APP、企业微信等形式进行可视化,方便学生个人的查询和指导老师的访问。比如图2,软件工程的学生张三,专业课程排名较高,出勤率较高,说明张三对软件工程专业的兴趣度较高;张三选修次数最多科目是经济学,选修课的成绩较高,说明张三除了软件工程之外,他对经济学的内容也比较感兴趣。平时上网访问的内容集中在金融资讯。因此老师可以鼓励张三多学习经济、金融的知识,未来就业也可以多关注金融、互联网金融等方面的公司职位。
3 学生学习兴趣分析存在的困难和挑战
利用校园数据挖掘学生学习兴趣对学生个人和学校本身都具有积极性影响,尽管如此,使用校园数据挖掘学生学习兴趣,仍然有一些不能忽视的困难和挑战。
3.1 大数据平台构建的积极性
随着教育信息化的发展,校园办公、教学等电子系统得到广泛使用。在大多数高校中,大数据平台除了为学生开展课程、参与相关比赛而搭建,并没有在全校园内进行广泛使用。要大数据技术在校园内得到有效应用,需要学校给予足够重视,并且积极构建大数据平台。
3.2 打破各部门数据壁垒
校园数据涉及学校众多部门,每个部门有各自的管理系统,这使得各部门管理运作相对独立,但是同时带来数据难以共享等问题。利用大数据可以在技术层面上打破部门数据壁垒,使得各个部门数据统一采集到大数据平台。但仍然需要学校领导积极协调各个部门,才能使工作名正言顺地开展。
3.3 确保数据安全性
数据安全是数据挖掘分析的重要挑战。当发生学生隐私数据泄露事件,将会对学生产生负面影响,同时也会对学校形象产生不可估量的消极影响。对采集数据进行私隐分类,对于涉及学生隐私的数据,在采集之前要进行询问,征得同意后方可采集。要建立完善的数据保密机制,规范化使用数据流程,防止数据泄露。建立在合法、安全、保护学生隐私的基础上,数据挖掘分析才有意义。
4 结 论
随着校园信息化推进、大数据技术发展,利用大数据技术挖掘校园数据成为教育数据挖掘领域其中一个重要分支。其挖掘结果可以应用到教育、管理、学生行为预警等方面。利用校园数据挖掘学生学习兴趣不仅可以帮助学生深入了解自己,并且帮助学校和老师更有针对性地指导学生,达到双赢效果。
参考文献:
[1] 杨龙.基于大数据和人工智能的高校信息化服务研究 [J].实验技术与管理,2018,35(11):153-156.
[2] 杨天敏.大数据时代下的高校智慧校园建设探究 [J].计算机时代,2019(9):107-109.
[3] 徐焱.基于教育数据挖掘的个性化自适应学习系统研究 [J].中国教育信息化,2019(11):60-65.
[4] 雷晓锋,杨明.教育数据挖掘的研究进展与趋势 [J].北京航空航天大学学报(社会科学版),2018,31(4):108-114.
[5] 曹慧娟,王晓春,刘彦蓉.国内教育数据挖掘文献的知识图谱分析 [J].中国教育信息化,2019(17):5-8.
[6] 丁国勇,程晋宽.高校學生学业表现研究:历史回顾、现实问题与未来路向 [J].黑龙江高教研究,2019,37(10):52-56.
[7] 王正青,但金凤.大数据时代美国教育数据质量管理流程与保障 [J].现代远程教育研究,2019,31(5):96-103+112.
[8] 胡刃锋,李瑶.教育大数据研究热点探析 [J].延边教育学院学报,2018,32(2):58-60+63.
[9] 张宁.学习分析:大数据时代高等教育变革的重要动力 [J].中国成人教育,2018(20):17-19.
[10] 王军,孙蓓.基于大数据的高职学生行为分析与平台研究 [J].现代信息科技,2019,3(8):13-15.
[11] 余琳,许婷,李超,等.大数据背景下的学生孤独预警模型——以华中师范大学为例 [J].现代信息科技,2019,3(23):1-4.
作者简介:郑倩如(1985—),女,汉族,广东广州人,讲师,博士,研究方向:数据挖掘,大数据;邹才凤(1980—),女,汉族,广东广州人,副教授,博士,研究方向:数据挖掘,大数据。