论文部分内容阅读
摘 要: 应用大数据、聚类算法等技术实现高校贫困生认定与管理系统云平台的设计,有利于高校扶贫工作的精准化、理性化、科学化。采用HDFS架构的高校贫困生认定与管理系统云平台,技术难度较低,数据处理效率较高。
关键词: 大数据;贫困生;系统
中图分类号: TP391.4 文献标识码: A DOI:10.3969/j.issn.1003-6970.2020.08.011
本文著录格式:郑丽波,师东菊,相悦丽,等. 高校贫困生认定与管理信息系统云平台的设计与实现——以牡丹江医学院为例[J]. 软件,2020,41(08):37-39
【Abstract】: The application of big data, clustering algorithm and other technologies to realize the design of the cloud platform for the identification and management system of poor students in Colleges and universities is conducive to the accuracy, rationalization and scientization of poverty alleviation work in Colleges and universities. The cloud platform of the identification and management system for poor students in Colleges and Universities Based on HDFS architecture has low technical difficulty and high data processing efficiency.
【Key words】: Big data; Poor students; System
0 引言
党的19大强调指出要健全学生资助制度,教育部2017年的《高校思想政治工作质量提升工程实施纲要》指出要构建资助育人等育人体系,提升高校思想政治教育的工作质量,意味着高校资助工作已不单纯的是服务保障和经济资助[1]。在对贫困大学生进行资助的过程中,贫困生身份认定、资助金额等对贫困生资助工作的效率与质量会产生重要的影响。精准资助的模式下的高校贫困生资助工作需要达到对象精准、资助力度精准、名额与资金分配精准以及发放精准四点要求[2]。
将大数据资源与处理技术应用于高校贫困生精准模式种,能够为精准资助对象、力度及名额的确定提供有效的前提,基于大数据的高校贫困生认定与管理信息系统,能够使资助资源系统化,通过大数据分析方法对扶贫数据进行资源系统化,通过大数据分析理念与方法对扶贫数据进行整合分析,对相关人員信息进行规范化与系统化处理,能够提升扶贫数据的动态性、智能性、利用数据信息平台,能够使精细化监管的目的,打破扶贫监管工作的时间与空间限制[3]。
2015年8月,国家教育部出台《国家学生资助政策体系简介》,该简介指出,党和政府高度重视家庭经济困难学生。近些年,各级政府部门相继出台相关资助政策[4]。根据教育部调查结果显示:目前我国高校存在经济困难的学生占在校学生的15%-20%,而且,每年也有因家庭困难而选择退学的学生。社会对高校贫困生现象高度关注。高校贫困生的资助工作已称为当前的高校扶贫领域的重要内容[5]。然而,由于高校贫困生的认定工作由于各个学校的认定方式不尽相同,资助的效果也产生较大差异。贫困生的精准认定模式仍需要进一步改进。高校对贫困生的认定方法必须要与时俱进。本文结合牡丹江医学院的实际提出一种贫困生的认定与管理信息系统[6]。
1 相关技术
基于当前高校贫困生认定工作的现状,调研结果显示目前我国高校贫困生认定工作存在一定的问题:(1)贫困生工作人为因素较多;(2)高校贫困生的相关数据量极大;(3)高校贫困生的数据挖掘方式有待提高[7]。基于上述问题,本文依托高校贫困生,选取合适的算法对贫困生的进行评估分析,进而对贫困生认定提供决策。因此,本研究采用Hadoop数据平台进行大数据处理[8]。
1.1 Hadoop分布技术
随着信息技术的快速发展,Hadoop平台的海量数据分析技术已经得到广泛的应用。该平台具有开源,成本低的优点。其框架为HDFS(Hadoop Distributed File System)分布式文件系统与MapReduce并行计算模型[9]。HDFS提高容错性的基础为:分布式管理、存储数据,即将大数据文件进行文件分片存储在不同集群节点上,并在不同机器节点上进行备份。HDFS系统采用M/S的架构(即Master/Slave)的架构来存储数据,由一个管理节点NameNode(Master)和多个数据节点DataNode(Slave)共同组成,NameNode管理节点负责管理HDFS的运行,维护整个系统中的元数据,处理客户端的读写请求。DataNode用于存储数据,可读写不可更改[11]。MapReduce主要用于大规模的数据采集的运算,其核心思想为:分散数据操作于在主节点的管理下对每个节点进行分发,然后进行整合,获取最终的结果。MapReduce的核心操作为Map和Reduce两部分组成,Map用于数据分割、整理。Reduce进行并行计算,对结果进行汇总。Hadoop组件如图1所示[12]。
1.2 HDFS系统架构
HDFS的主要作用为存储数据,HDFS的架构设计较为安全,在一般情况下,DataNode负责备份数据块,目的在于即使DataNode节点出现故障,即使不能访问该故障的Data-Node,还可以使用其他的节点。当客户端client需要进行HDFS写操作时,客户端首先调用NameNode[13]。 1.3 Hive数据仓库
Hive作为Hadoop集群中一个数据仓库,功能强大,可以将结构化的数据文件转换为可以使用的SQL查询的数据表。Hive的查询语句十分简单,与SQL查询语句想类似。Hive允许自行定义Mapper和Reducer来处理数据[13]。
1.4 数据挖掘算法
数据挖掘算法采用聚类算法,即基于事务外在的特征,经过相似度计算,时的具有较高相似的对象划分到一类,以分析出同一类别共性与不同类别之间的差异性问题,以便于进一步数据挖掘。聚类算法的种类主要事基于层次的聚类和基于划分的聚类、基于密度的聚类、基于网格的聚类、基于模型的聚类。本贫困生认定与管理系统采用基于划分的聚类算法(K-means),适用于大数据运算[14]。
2 贫困生认定与管理系统的数据统计分析
为真实的分析判断学生在校园网络和学校食堂的消费数据,需了解下学生在校的实际情况,通过分析学生在校行为,判定学生的贫困生的程度。通过统计学分析,应用K-means算法调参、调优等操作,进行数据的模型训练和判断。
本研究使用的数据来源于牡丹江医学院2018年9月-2019年12月学生食堂消费记录和学生校内超市、洗浴、图书馆门禁及借阅记录,充值记录。其中以食堂消费记录为主。如表1所示,学生食堂饭卡消费记录中包括学号、消费时间、消费金额、消费地点[15]。
2.1 学生消费数据预处理
学生在学校食堂的消费记录包括了学生的消费时间、消费地点、消费金额。学生的食堂消费情况可以反映出学生的消费能力[17]。对贫困生的认定提供借鉴和参考。消费记录分析包括月每天刷卡消费金额分析、日各时段刷卡频率分析,通过对学生的消费行为进行数据聚类算法分析,贫困生认定人员可挖掘贫困生在校消费习惯[18]。在使用算法对数据进行数据挖掘之前,需对数据缺失、有噪声数据进行整理即对缺失值、噪声数据进行去除工作[19]。缺失值除了方法为删除数据、均值填充、插补数据、异常值处理即远离正常值范围的数据点(“离散点”)。例如学生在食堂一次性花费100元,该学生的消费出现异常,此时应该以其他的消费记录填充情况进行缺失值处理填充本次消费。
本实验研究基于高校学生的数据,为了便于聚类分析,需要将学生的数据进行离散化,按照数据进行等宽划分。
2.2 原始数据离散化
学生食堂消费数据按照等宽划分为五个区间,即很高、高、中、低、很低来划分[21]。每餐消费在10元以下为很低、每餐消费在10-20元为低,20元-30元为中,30-40为高,40元以上为很高[22]。按照此分类,将学生的消费等级离散化,应用聚类质量对比实验,提取特征值,通过随机抽样和轮廓系数来验证。在不同K值下进行实验,调参、调优的方式取最优的聚类结果进行对比[22]。
3 结果与讨论
为实现高校的精准扶贫,提高育人实效,本贫困生认定与管理系统的设计与实现涵盖了高校学生食堂、校园等消费情况,并结合医学院校的实际,用学生的消费“数据”作为贫困生认定的标准、参考,使国家助学金等资助体系更精准的落实,使学生工作人员高校贫困生认定工作更理性。同时,大数据的数据分析,也有助于在信息化背景下,开创思想政治教育的与时俱进和科学化、理性化。大数据的运用将成为今后高校学生资助工作的重要手段,基于大数据的高校贫困生认定对切实提高育人成效、客观、完善高校资助育人体系、落实教育精准扶贫政策有着重要的意义[23]。运用大数据的整理和聚类分析,解决了当前贫困生认定工作的主观化的问题,并通过大数据的手段提高认定的准确性,确保国家的贫困生资助政策落到实处,维护贫困生的合法权益[22]。对高校而言,基于大数据的高校贫困生认定与管理信息系统云平台,有利于完善高校资助育人体系,突出了多种育人导向。同时建立了贫困生的数据库,进行动态管理,对完善整个资助育人体系有着重要的作用[24]。基于大数据的贫困生认定与管理系统,有利于實现高校学生的减贫、社会的公平,同时为高校学生的思想政治教育创新了途径,体现了党和政府对高校贫困生扶贫工作的重视,也充分体现了高校学生管理的优势。
参考文献
[1] 张维佳, 马英. 高校贫困生精准扶贫档案的构建[J]. 兰台世界. 2018(06): 113-115.
[2] 周琼, 李海山. 我国高校贫困生资助体系的现状及反思[J]. 文教资料. 2006(11): 190.
[3] 韩俊江, 郭晖艳. 我国高校贫困大学生救助政策探析[J]. 教育理论与实践. 2012(22): 37-40.
[4] 魏立恭, 罗国玮. 高校贫困生资助系统的研究与实现[J]. 广西师范学院学报(自然科学版). 2011(03): 29-30.
[5] 毕鹤霞. 中国高校贫困生判别方法及其认同度的实证研究[J]. 高教探索. 2011(04): 115-117
[6] 赵丽荣, 高健. 关于高校贫困生扶贫措施的现状分析及对策研究[J]. 中国成人教育. 2009(16): 66-68.
[7] 杨晴. 高校贫困生认定的路径[J]. 教育学术月刊. 2009(08): 15-18.
[8] 毕鹤霞. 国内外高校贫困生认定与研究述评[J]. 比较教育研究. 2009(01): 18-20.
[9] 赵炳起. 高校贫困生认定机制——优化与重构[J]. 教育财会研究. 2006(04): 18-22.
[10] 陈靓, 张少明, 谷磊磊, 等. 大数据在高校贫困生认定工作中的应用[J]. 理论观察. 2018(08): 32-35.
[11] 陈雅丽. 谈高校家庭经济困难学生认定工作的优化策略[J]. 知识经济. 2018(14): 112-113.
[12] 赵丽莎. 高校家庭经济困难学生认定工作中的问题及对策[J]. 赤峰学院学报(自然科学版). 2015(13): 11-14.
[13] 莫光辉. 大数据在精准扶贫过程中的应用及实践创新[J]. 求实. 2016(10): 12-13.
[14] 刘玉霞. 大数据背景下高校精准资助路径探析[J]. 未来与发展. 2016(09): 5-8.
[15] 兰嫒, 沈针, 徐力勇, 等. 新常态下高校贫困生资助工作的思考[J]. 西部皮革. 2016(22): 8-10.
[16] 习近平. 决胜全面建成小康社会夺取新时代中国特色社会主义伟大胜利——在中国共产党第十九次全国代表大会上的报告[M]. 北京: 人民出版社, 2017.
[17] 罗丽琳. 大数据视域下高校进准资助模式构建研究[J]. 教育研究, 2018, 24(2): 197-204.
[18] 林于良, 丁一岚. 大数据提升高校精准资助成效的路径分析[J]. 黑河学刊, 2017, 234(6): 186-188.
[19] 刘玉霞. 大数据背景下高校精准资助路径探析[J]. 未来与发展, 2016(09): 69-73 .
[20] 凌云. 用大数据思维解决高校贫困生精准化资助问题[J]. 创新创业教育, 2017(06): 128-131.
[21] 张福友. 关于普通高校学生精准资助工作的理路[J]. 黑龙江高教研究, 2015(11): 78-80
[22] 张远航. 论高校家庭经济困难学生的“精准资助”[J]. 思想理论教育, 2016(01): 108-111.
[23] 余亮, 陈时见, 赵彤. 大数据背景下数字教育资源服务的内涵、特征和模式[J]. 电化教育研究, 2017, 18(4): 66-71.
[24] 莫光辉. 大数据在精准扶贫过程中的应用及实践创新[J]. 求实, 2016, 15(10): 87-96.
关键词: 大数据;贫困生;系统
中图分类号: TP391.4 文献标识码: A DOI:10.3969/j.issn.1003-6970.2020.08.011
本文著录格式:郑丽波,师东菊,相悦丽,等. 高校贫困生认定与管理信息系统云平台的设计与实现——以牡丹江医学院为例[J]. 软件,2020,41(08):37-39
【Abstract】: The application of big data, clustering algorithm and other technologies to realize the design of the cloud platform for the identification and management system of poor students in Colleges and universities is conducive to the accuracy, rationalization and scientization of poverty alleviation work in Colleges and universities. The cloud platform of the identification and management system for poor students in Colleges and Universities Based on HDFS architecture has low technical difficulty and high data processing efficiency.
【Key words】: Big data; Poor students; System
0 引言
党的19大强调指出要健全学生资助制度,教育部2017年的《高校思想政治工作质量提升工程实施纲要》指出要构建资助育人等育人体系,提升高校思想政治教育的工作质量,意味着高校资助工作已不单纯的是服务保障和经济资助[1]。在对贫困大学生进行资助的过程中,贫困生身份认定、资助金额等对贫困生资助工作的效率与质量会产生重要的影响。精准资助的模式下的高校贫困生资助工作需要达到对象精准、资助力度精准、名额与资金分配精准以及发放精准四点要求[2]。
将大数据资源与处理技术应用于高校贫困生精准模式种,能够为精准资助对象、力度及名额的确定提供有效的前提,基于大数据的高校贫困生认定与管理信息系统,能够使资助资源系统化,通过大数据分析方法对扶贫数据进行资源系统化,通过大数据分析理念与方法对扶贫数据进行整合分析,对相关人員信息进行规范化与系统化处理,能够提升扶贫数据的动态性、智能性、利用数据信息平台,能够使精细化监管的目的,打破扶贫监管工作的时间与空间限制[3]。
2015年8月,国家教育部出台《国家学生资助政策体系简介》,该简介指出,党和政府高度重视家庭经济困难学生。近些年,各级政府部门相继出台相关资助政策[4]。根据教育部调查结果显示:目前我国高校存在经济困难的学生占在校学生的15%-20%,而且,每年也有因家庭困难而选择退学的学生。社会对高校贫困生现象高度关注。高校贫困生的资助工作已称为当前的高校扶贫领域的重要内容[5]。然而,由于高校贫困生的认定工作由于各个学校的认定方式不尽相同,资助的效果也产生较大差异。贫困生的精准认定模式仍需要进一步改进。高校对贫困生的认定方法必须要与时俱进。本文结合牡丹江医学院的实际提出一种贫困生的认定与管理信息系统[6]。
1 相关技术
基于当前高校贫困生认定工作的现状,调研结果显示目前我国高校贫困生认定工作存在一定的问题:(1)贫困生工作人为因素较多;(2)高校贫困生的相关数据量极大;(3)高校贫困生的数据挖掘方式有待提高[7]。基于上述问题,本文依托高校贫困生,选取合适的算法对贫困生的进行评估分析,进而对贫困生认定提供决策。因此,本研究采用Hadoop数据平台进行大数据处理[8]。
1.1 Hadoop分布技术
随着信息技术的快速发展,Hadoop平台的海量数据分析技术已经得到广泛的应用。该平台具有开源,成本低的优点。其框架为HDFS(Hadoop Distributed File System)分布式文件系统与MapReduce并行计算模型[9]。HDFS提高容错性的基础为:分布式管理、存储数据,即将大数据文件进行文件分片存储在不同集群节点上,并在不同机器节点上进行备份。HDFS系统采用M/S的架构(即Master/Slave)的架构来存储数据,由一个管理节点NameNode(Master)和多个数据节点DataNode(Slave)共同组成,NameNode管理节点负责管理HDFS的运行,维护整个系统中的元数据,处理客户端的读写请求。DataNode用于存储数据,可读写不可更改[11]。MapReduce主要用于大规模的数据采集的运算,其核心思想为:分散数据操作于在主节点的管理下对每个节点进行分发,然后进行整合,获取最终的结果。MapReduce的核心操作为Map和Reduce两部分组成,Map用于数据分割、整理。Reduce进行并行计算,对结果进行汇总。Hadoop组件如图1所示[12]。
1.2 HDFS系统架构
HDFS的主要作用为存储数据,HDFS的架构设计较为安全,在一般情况下,DataNode负责备份数据块,目的在于即使DataNode节点出现故障,即使不能访问该故障的Data-Node,还可以使用其他的节点。当客户端client需要进行HDFS写操作时,客户端首先调用NameNode[13]。 1.3 Hive数据仓库
Hive作为Hadoop集群中一个数据仓库,功能强大,可以将结构化的数据文件转换为可以使用的SQL查询的数据表。Hive的查询语句十分简单,与SQL查询语句想类似。Hive允许自行定义Mapper和Reducer来处理数据[13]。
1.4 数据挖掘算法
数据挖掘算法采用聚类算法,即基于事务外在的特征,经过相似度计算,时的具有较高相似的对象划分到一类,以分析出同一类别共性与不同类别之间的差异性问题,以便于进一步数据挖掘。聚类算法的种类主要事基于层次的聚类和基于划分的聚类、基于密度的聚类、基于网格的聚类、基于模型的聚类。本贫困生认定与管理系统采用基于划分的聚类算法(K-means),适用于大数据运算[14]。
2 贫困生认定与管理系统的数据统计分析
为真实的分析判断学生在校园网络和学校食堂的消费数据,需了解下学生在校的实际情况,通过分析学生在校行为,判定学生的贫困生的程度。通过统计学分析,应用K-means算法调参、调优等操作,进行数据的模型训练和判断。
本研究使用的数据来源于牡丹江医学院2018年9月-2019年12月学生食堂消费记录和学生校内超市、洗浴、图书馆门禁及借阅记录,充值记录。其中以食堂消费记录为主。如表1所示,学生食堂饭卡消费记录中包括学号、消费时间、消费金额、消费地点[15]。
2.1 学生消费数据预处理
学生在学校食堂的消费记录包括了学生的消费时间、消费地点、消费金额。学生的食堂消费情况可以反映出学生的消费能力[17]。对贫困生的认定提供借鉴和参考。消费记录分析包括月每天刷卡消费金额分析、日各时段刷卡频率分析,通过对学生的消费行为进行数据聚类算法分析,贫困生认定人员可挖掘贫困生在校消费习惯[18]。在使用算法对数据进行数据挖掘之前,需对数据缺失、有噪声数据进行整理即对缺失值、噪声数据进行去除工作[19]。缺失值除了方法为删除数据、均值填充、插补数据、异常值处理即远离正常值范围的数据点(“离散点”)。例如学生在食堂一次性花费100元,该学生的消费出现异常,此时应该以其他的消费记录填充情况进行缺失值处理填充本次消费。
本实验研究基于高校学生的数据,为了便于聚类分析,需要将学生的数据进行离散化,按照数据进行等宽划分。
2.2 原始数据离散化
学生食堂消费数据按照等宽划分为五个区间,即很高、高、中、低、很低来划分[21]。每餐消费在10元以下为很低、每餐消费在10-20元为低,20元-30元为中,30-40为高,40元以上为很高[22]。按照此分类,将学生的消费等级离散化,应用聚类质量对比实验,提取特征值,通过随机抽样和轮廓系数来验证。在不同K值下进行实验,调参、调优的方式取最优的聚类结果进行对比[22]。
3 结果与讨论
为实现高校的精准扶贫,提高育人实效,本贫困生认定与管理系统的设计与实现涵盖了高校学生食堂、校园等消费情况,并结合医学院校的实际,用学生的消费“数据”作为贫困生认定的标准、参考,使国家助学金等资助体系更精准的落实,使学生工作人员高校贫困生认定工作更理性。同时,大数据的数据分析,也有助于在信息化背景下,开创思想政治教育的与时俱进和科学化、理性化。大数据的运用将成为今后高校学生资助工作的重要手段,基于大数据的高校贫困生认定对切实提高育人成效、客观、完善高校资助育人体系、落实教育精准扶贫政策有着重要的意义[23]。运用大数据的整理和聚类分析,解决了当前贫困生认定工作的主观化的问题,并通过大数据的手段提高认定的准确性,确保国家的贫困生资助政策落到实处,维护贫困生的合法权益[22]。对高校而言,基于大数据的高校贫困生认定与管理信息系统云平台,有利于完善高校资助育人体系,突出了多种育人导向。同时建立了贫困生的数据库,进行动态管理,对完善整个资助育人体系有着重要的作用[24]。基于大数据的贫困生认定与管理系统,有利于實现高校学生的减贫、社会的公平,同时为高校学生的思想政治教育创新了途径,体现了党和政府对高校贫困生扶贫工作的重视,也充分体现了高校学生管理的优势。
参考文献
[1] 张维佳, 马英. 高校贫困生精准扶贫档案的构建[J]. 兰台世界. 2018(06): 113-115.
[2] 周琼, 李海山. 我国高校贫困生资助体系的现状及反思[J]. 文教资料. 2006(11): 190.
[3] 韩俊江, 郭晖艳. 我国高校贫困大学生救助政策探析[J]. 教育理论与实践. 2012(22): 37-40.
[4] 魏立恭, 罗国玮. 高校贫困生资助系统的研究与实现[J]. 广西师范学院学报(自然科学版). 2011(03): 29-30.
[5] 毕鹤霞. 中国高校贫困生判别方法及其认同度的实证研究[J]. 高教探索. 2011(04): 115-117
[6] 赵丽荣, 高健. 关于高校贫困生扶贫措施的现状分析及对策研究[J]. 中国成人教育. 2009(16): 66-68.
[7] 杨晴. 高校贫困生认定的路径[J]. 教育学术月刊. 2009(08): 15-18.
[8] 毕鹤霞. 国内外高校贫困生认定与研究述评[J]. 比较教育研究. 2009(01): 18-20.
[9] 赵炳起. 高校贫困生认定机制——优化与重构[J]. 教育财会研究. 2006(04): 18-22.
[10] 陈靓, 张少明, 谷磊磊, 等. 大数据在高校贫困生认定工作中的应用[J]. 理论观察. 2018(08): 32-35.
[11] 陈雅丽. 谈高校家庭经济困难学生认定工作的优化策略[J]. 知识经济. 2018(14): 112-113.
[12] 赵丽莎. 高校家庭经济困难学生认定工作中的问题及对策[J]. 赤峰学院学报(自然科学版). 2015(13): 11-14.
[13] 莫光辉. 大数据在精准扶贫过程中的应用及实践创新[J]. 求实. 2016(10): 12-13.
[14] 刘玉霞. 大数据背景下高校精准资助路径探析[J]. 未来与发展. 2016(09): 5-8.
[15] 兰嫒, 沈针, 徐力勇, 等. 新常态下高校贫困生资助工作的思考[J]. 西部皮革. 2016(22): 8-10.
[16] 习近平. 决胜全面建成小康社会夺取新时代中国特色社会主义伟大胜利——在中国共产党第十九次全国代表大会上的报告[M]. 北京: 人民出版社, 2017.
[17] 罗丽琳. 大数据视域下高校进准资助模式构建研究[J]. 教育研究, 2018, 24(2): 197-204.
[18] 林于良, 丁一岚. 大数据提升高校精准资助成效的路径分析[J]. 黑河学刊, 2017, 234(6): 186-188.
[19] 刘玉霞. 大数据背景下高校精准资助路径探析[J]. 未来与发展, 2016(09): 69-73 .
[20] 凌云. 用大数据思维解决高校贫困生精准化资助问题[J]. 创新创业教育, 2017(06): 128-131.
[21] 张福友. 关于普通高校学生精准资助工作的理路[J]. 黑龙江高教研究, 2015(11): 78-80
[22] 张远航. 论高校家庭经济困难学生的“精准资助”[J]. 思想理论教育, 2016(01): 108-111.
[23] 余亮, 陈时见, 赵彤. 大数据背景下数字教育资源服务的内涵、特征和模式[J]. 电化教育研究, 2017, 18(4): 66-71.
[24] 莫光辉. 大数据在精准扶贫过程中的应用及实践创新[J]. 求实, 2016, 15(10): 87-96.