论文部分内容阅读
摘 要:近些年高职院校招生政策的逐渐放宽,来自贫困地区的高职院校大学生越来越多,增加了高校贫困生资助部门的难度和工作量。传统的贫困生认定方式需要学生出具家庭贫困证明,然后在学校填写贫困生申请表,再由学校组织评议小组对申请人进行评议,然而学生填写的家庭贫困证明经常出现虚假申报的情况,资助管理部门并不能真实掌握学生家庭情况。因此,如何在缺乏真实家庭情况,以及助学金金额有限的背景下,将贫困助学金发放到最需要帮助的学生手上成为亟待解决的问题。
关键词:数据挖掘;贫困生测评;校园一卡通
1.引言
高职贫困学生主要是指高等职业院校家庭经济较为困难,难以支付起学费、生活费及学杂费,且不能保障正常生活的学生,根据其情况可以分为特别贫困学生和普通贫困学生。高职贫困生资助评定成为高学生管理工作中的热点问题。由于贫困助学金的发放关系到贫困学生的切身利益,因此有着重要的实际意义。
目前从总体情况来看,在实际的贫困学生认定过程中,辅导员和学生都过度依赖事情的表面现象,存在相当大的盲目性,此外,也存在相当大的主观意识判断,导致错判与误判等情况发生。因此,在进行贫困学生认定过程中,我们需要采取多种方式来进行判定,尽量减少在评定过程中出现的人为因素。
2.一卡通消费数据的研究价值
通过对一卡通中的学生消费数据分析,辅助贫困生的辨认,找出数据之间存在的联系,是本文研究的目的。目前在大部分高职中,食堂就餐、校园超市、水费、电费、图书馆等只支持刷卡方式,不支持现金支付,因此,一卡通的消费数据具有很强的代表性,这些数据具有很好的研究价值,通过分析数据可以了解大学生的消费习惯和消费行为。
以泸州职业技术学院为例,我校大学生作为一类消费群体,有很大的消费数据,通过对其消费数据进行挖掘和分析,就会发现其中的一些规律和问题,了解学生的贫困情况,对贫困生的评定、奖学金的设定、助学金的设定提供很好的依据,对判别学生是否为贫困生具有非常重大的意义。
3.數据挖掘过程及算法应用
数据挖掘一般由数据转换、数据准备、数据分析、结果分析、知识同化五个部分组成。数据挖掘通过对导入到数据仓库中的数据进行挖掘,找出数据之间的关系,根据其存在的某种关系,对未来的数据进行预测。
截至2020年,泸州职业技术学院全日制在校生约为14000人左右,在学校的一卡通系统产生的数据中,数据信息都是由很多选项组成,如学生学号、姓名、消费数据等,在对数据进行挖掘时,需要对相关的数据进行相应的处理,去除一些不必要的信息。本文主要是进行对学校贫困学生进行评定,因此选用的是与学生的消费相关的数据项,对于学生性别、年龄等与贫困相关不大的数据项消除掉。
在一卡通系统中,各个子系统分别产生相关的数据,如果对其中的数据进行挖掘,需要通过一定的处理,首先将一卡通的数据进行分析提取,可以分为几张表:学生信息表、学生就餐消费表、学生阅读情况表、学生成绩表等数据表作为源数据,从中提取出用来与贫困认定有关的数据项,对这些数据进行相应的格式转换,为下一步的挖掘工作打下基础。
在数据表中,消费金额是一个数值数据,而关联规则不能够处理相关的数值数据,在对它进行关联之前,需要对这个项进行离散型转换,使之能被操作,再对转换后的数据进行排序,使关系数据变换成相关的事务数据。
在对数据进行相应的转换后,就可以应用相应的挖掘关联规则进行操作了,在操作的过程中,还需要对其进行最小可信度和支持度进行设置,如若支持度设置过高,则在挖掘过程中使用的挖掘规则较少,则挖掘出结果越快。本文对数据进行挖掘采用的是FP-Growth算法和INFP-Growth算法,通过使用这两种算法对待挖掘的数据进行关联规则挖掘,在这里,我们设置最小支持度的值为2,可信度为0.5,生成的规则如下:
(1)对于学生成绩较好的同学,如班级排名前十,则可以申请助学贷款,如若家庭情况困难,则可申请三年的助学贷款(支持度为2,可信度为1)。
(2)对于户籍为农村的学生,且家庭情况为特困户,则可申请年限两年的助学贷款(支持度为2,可信度为0.95)。
(3)需要申请助学贷款与申请勤工助学的学生(支持度为2,可信度为0.35)。
(4)申请特困及申请勤工助学(支持度为0.6,可信度为0.23)。
通过使用关联规则的方法对数据进行分析,可以得出贫困学生的消费情况、参与勤工助学活动、学习成绩之间的关系,这些关系可以为学校对学生的贫困工作认定提供一些帮助。
在对可信度和支持度进行选取的过程中,一定要根据实际的情况来选取,这样才会得到所需的结果,如果选取的值过于小,在执行的过程中会产生很多多余的规则,不仅会影响执行的效率,得到的结果也可能是不准确的,但如果选用的值过大,则会产生生成的规则较少的情况,会造成规则设置不准确,导致相关数据漏网情况。
4.结束语
本文主要针对高职贫困生评价问题,结合了数据仓库和数据挖掘等解决方案在其他领域的应用状况,提出了将数据仓库引入到高职 贫困生评价数据平台的数据分析过程中。研究表明,本研究的开展进行使得高职管理决策者能够利用数据仓库中的数据进行更理性、更科学的决策。
参考文献
[1] “精准扶贫”理念在高等院校思想政治教育中的指导意义[J]. 王振兴. 当代教育实践与教学研究. 2019(01)
[2] 高校精准扶贫工作的落实与路径分析[J]. 朱虹,覃向梅,陆蕾. 职业. 2019(13)
[3] 发挥高等院校优势,做好精准扶贫工作[J]. 韩瑜,王欢. 科学咨询(教育科研). 2019(08)
[4] 精准扶贫视野下高校资助育人体系的构建[J]. 金明媚. 继续教育研究. 2019(01)
作者简介:龙小宏(1976-),男,汉,四川泸州,讲师,硕士,主要研究方向:计算机网络技术、计算机应用技术;
周静(1979-),女,汉,四川泸州,讲师,硕士,主要研究方向:互联网应用开发、软件技术。
关键词:数据挖掘;贫困生测评;校园一卡通
1.引言
高职贫困学生主要是指高等职业院校家庭经济较为困难,难以支付起学费、生活费及学杂费,且不能保障正常生活的学生,根据其情况可以分为特别贫困学生和普通贫困学生。高职贫困生资助评定成为高学生管理工作中的热点问题。由于贫困助学金的发放关系到贫困学生的切身利益,因此有着重要的实际意义。
目前从总体情况来看,在实际的贫困学生认定过程中,辅导员和学生都过度依赖事情的表面现象,存在相当大的盲目性,此外,也存在相当大的主观意识判断,导致错判与误判等情况发生。因此,在进行贫困学生认定过程中,我们需要采取多种方式来进行判定,尽量减少在评定过程中出现的人为因素。
2.一卡通消费数据的研究价值
通过对一卡通中的学生消费数据分析,辅助贫困生的辨认,找出数据之间存在的联系,是本文研究的目的。目前在大部分高职中,食堂就餐、校园超市、水费、电费、图书馆等只支持刷卡方式,不支持现金支付,因此,一卡通的消费数据具有很强的代表性,这些数据具有很好的研究价值,通过分析数据可以了解大学生的消费习惯和消费行为。
以泸州职业技术学院为例,我校大学生作为一类消费群体,有很大的消费数据,通过对其消费数据进行挖掘和分析,就会发现其中的一些规律和问题,了解学生的贫困情况,对贫困生的评定、奖学金的设定、助学金的设定提供很好的依据,对判别学生是否为贫困生具有非常重大的意义。
3.數据挖掘过程及算法应用
数据挖掘一般由数据转换、数据准备、数据分析、结果分析、知识同化五个部分组成。数据挖掘通过对导入到数据仓库中的数据进行挖掘,找出数据之间的关系,根据其存在的某种关系,对未来的数据进行预测。
截至2020年,泸州职业技术学院全日制在校生约为14000人左右,在学校的一卡通系统产生的数据中,数据信息都是由很多选项组成,如学生学号、姓名、消费数据等,在对数据进行挖掘时,需要对相关的数据进行相应的处理,去除一些不必要的信息。本文主要是进行对学校贫困学生进行评定,因此选用的是与学生的消费相关的数据项,对于学生性别、年龄等与贫困相关不大的数据项消除掉。
在一卡通系统中,各个子系统分别产生相关的数据,如果对其中的数据进行挖掘,需要通过一定的处理,首先将一卡通的数据进行分析提取,可以分为几张表:学生信息表、学生就餐消费表、学生阅读情况表、学生成绩表等数据表作为源数据,从中提取出用来与贫困认定有关的数据项,对这些数据进行相应的格式转换,为下一步的挖掘工作打下基础。
在数据表中,消费金额是一个数值数据,而关联规则不能够处理相关的数值数据,在对它进行关联之前,需要对这个项进行离散型转换,使之能被操作,再对转换后的数据进行排序,使关系数据变换成相关的事务数据。
在对数据进行相应的转换后,就可以应用相应的挖掘关联规则进行操作了,在操作的过程中,还需要对其进行最小可信度和支持度进行设置,如若支持度设置过高,则在挖掘过程中使用的挖掘规则较少,则挖掘出结果越快。本文对数据进行挖掘采用的是FP-Growth算法和INFP-Growth算法,通过使用这两种算法对待挖掘的数据进行关联规则挖掘,在这里,我们设置最小支持度的值为2,可信度为0.5,生成的规则如下:
(1)对于学生成绩较好的同学,如班级排名前十,则可以申请助学贷款,如若家庭情况困难,则可申请三年的助学贷款(支持度为2,可信度为1)。
(2)对于户籍为农村的学生,且家庭情况为特困户,则可申请年限两年的助学贷款(支持度为2,可信度为0.95)。
(3)需要申请助学贷款与申请勤工助学的学生(支持度为2,可信度为0.35)。
(4)申请特困及申请勤工助学(支持度为0.6,可信度为0.23)。
通过使用关联规则的方法对数据进行分析,可以得出贫困学生的消费情况、参与勤工助学活动、学习成绩之间的关系,这些关系可以为学校对学生的贫困工作认定提供一些帮助。
在对可信度和支持度进行选取的过程中,一定要根据实际的情况来选取,这样才会得到所需的结果,如果选取的值过于小,在执行的过程中会产生很多多余的规则,不仅会影响执行的效率,得到的结果也可能是不准确的,但如果选用的值过大,则会产生生成的规则较少的情况,会造成规则设置不准确,导致相关数据漏网情况。
4.结束语
本文主要针对高职贫困生评价问题,结合了数据仓库和数据挖掘等解决方案在其他领域的应用状况,提出了将数据仓库引入到高职 贫困生评价数据平台的数据分析过程中。研究表明,本研究的开展进行使得高职管理决策者能够利用数据仓库中的数据进行更理性、更科学的决策。
参考文献
[1] “精准扶贫”理念在高等院校思想政治教育中的指导意义[J]. 王振兴. 当代教育实践与教学研究. 2019(01)
[2] 高校精准扶贫工作的落实与路径分析[J]. 朱虹,覃向梅,陆蕾. 职业. 2019(13)
[3] 发挥高等院校优势,做好精准扶贫工作[J]. 韩瑜,王欢. 科学咨询(教育科研). 2019(08)
[4] 精准扶贫视野下高校资助育人体系的构建[J]. 金明媚. 继续教育研究. 2019(01)
作者简介:龙小宏(1976-),男,汉,四川泸州,讲师,硕士,主要研究方向:计算机网络技术、计算机应用技术;
周静(1979-),女,汉,四川泸州,讲师,硕士,主要研究方向:互联网应用开发、软件技术。