论文部分内容阅读
摘要:如何挖掘高校中特别困难学生的信息是高校学生资助工作的一项重要内容,为了在不影响学生自尊心前提下更好地发现高校中的特困学生,利用学校食堂后台刷卡记录,采用正态分布理论,构建了特困学生的挖掘模型。经实验检验该模型判定的正确率为82.6%,还新挖掘出了特困生总数2.79%的特困学生。为学校特困学生的认定提供了重要的科学依据。
关键词:食堂刷卡记录;正态分布;特困学生
一、引言
随着高等教育的发展,贫困地区和贫困家庭的孩子进入大学人数越来越多,据教育部的统计数据,截至2013年,全国高校贫困学生已经达到500余万,高校中的贫困学生比例已经高达20%,其中特困学生的比例达到总在校人数的5%以上。贫困生的资助工作也成各高校的一项重要的学生工作。
由于种种原因,各高校在贫困学生的认定和资助工作中,还存在很多问题。
1. 高校学生的贫困认定一般以学生在户籍所在地村委、乡镇政府或民政部门出据的相关证明材料为主要的依据之一,而这些证明材料中的数据往往以相关人员的主观为主,缺乏可信度。
2. 特困和一般贫困的界限不清楚,很多学校以划分比例或设定名额的方式进行“推选”,从而使特困生的认定结果在不同院系存在很大差异,最终认定的特困生不一定特困,而真正特困的学生有可能没有被发现。
3. 很多学生为了获得资助每当进行贫困认定时就哭穷,却拿着贫困资助的钱去进行请客吃喝等非贫困的消费,而学生相关部和老师每年只是按程序进行了相关贫困生的认定和资助工作,对特困学生的日常生活方面缺乏较合理的跟踪手段,不能及时发现真假特困生。
然而,学校食堂是学生在校期间的主要餐饮消费场所,信息时代学生的餐饮消费被全部记录,而学生食堂的消费最能体现学生的消费情况,并反映到该学生的经济情况。
二、研究现状
贫困生的认定工作是高校贫困生资助中最重要的工作之一,贫困的认定标准制定、认定流程和认定方法等都有不少学者进行了研究。黄永斌提出了高校自身认定法、在校消费水平认定法和综合认定法等三种方法;毕鹤霞等将校园判定与生源地判定相结合的方法,构建了贫困生的判定体系;葛超从贫困生证明真假难辨、贫困生的认定标准难以制定和认定方法的不科学性等三个方面分析的贫困生认定工作的难点,同时提出了完美相关法制、建立贫困生信息共享平台和改进贫困生认定手段等机制和措施;岑道权将学生的生活费支出、家庭人均收入、缴纳学费等方面相结合来完美贫困生的资助体系;肖蕾等从学生家庭真实经济情况、学生的人际关系对贫困认定的影响、国家无偿资助造成学生骗取资助现象等方面提出了完美家庭经济情况的审核、加强诚信教育和诚信档案建设,改变无偿性资助的现状等有效措施。
以上这些研究主要从贫困生的认定困难性、贫困生认定的判定体系和贫困相关政策等方面进行了研究,而尚无从所有学生中发现真正的贫困学生的研究成果。
陈晓等利用高校中的学生信息、学生家庭成员信息、学生家庭经济状况信息、成绩信息、月消费信息、助学贷款信息和贫困生申请表等学生多方面的信息,构建加权约束的决策树,用于提高贫困生的认定效率。该作者的研究综合了高校中几乎与学生有关的信息偷出,综合考虑学生的所有情况,但就学生的真正贫困情况而言并不具体深入。
综合以上情况,本文将以学生食堂消费记录为依据,采用正态分布理论,构建基于学生食堂消费记录的特困学生挖掘模型,从学生日常的餐饮消费记录中挖掘出真正需要资助的特困学生,也可以从中发现假的特困学生。为高等学校的特困学生认定和资助提供科学的参考依据。
三、特困生挖掘模型
由于高等学校是开放式办学,学生在校期间相对比较自由,因此学校并未要求学生必须要去学校食堂就餐,为挖掘特困学生,由于校外消费均远高于校内学生食堂,所以,假设特困学生绝大多数时间都在学校食堂就餐。
为衡量学生在学校食堂就餐的情况,列出单个学生在校就餐消费均值、全体学生食堂就餐消费均值和方差的定义。
定义1:设全校共有M个学生在食堂就餐,学生xi在校食堂总消费次数为Ni,每次消费金额为hi,单个学生的消费均值记为μi,全体学生的消费均值记为μ,全体学生的消费方差记为μ则有
μi=hi(1)
μ=Ei(2)
σ2=(μi-μ)2(3)
为了界定特别困难学生与其它学生的区别,列出学生消费阈值的定义。
定义2:设食堂消费记录采样天数为N,把学生的消费次数阈值记为N0,则有
N0=λN(4)
其中λ表示均值消费次数阈值系数,用于限制只有在食堂消费次数达到一定数量的学生才参与贫困生的判定。
为了使用离群点的理论来研究特困学生的挖掘方法,下面给出离群点的定义。
假设每个学生就餐的消费均值服从正态分布(如图1所示),记为N(μ,σ2),从图中可以看出,X轴上μ左右两侧各1σ 间的面积为68.27%,各 1.96σ间的面积为95.00%,各2.58σ间的面积为99.00%。
定义3:根据正态分布规律,将低于全体学生均值γσ的部分学生定义为特困学生。
根据(1)、(2)、(3)、(4)式和定义3,设学生xi每月在食堂消费的次数为Ni,每次的平均消费额为ui,则可构建特困学生判定模型如下:
f(xi)=1 Ni≥N0且μi≤μ-γσ
0 其它(5) 上述式中,f(x)=1表示学生x为特困学生,f(x)=0,则表示该学生不是特困学生。
四、实验分析
根据实验需要,某普通高等学校食堂后台采集到2014年2月26日至5月8日共71天的学生就餐刷卡记录739029条,由于食堂消费普通不高,因此先将单次消费高于20元的记录作为噪声去掉,经过去噪后有效记录为737252条。
预处理后的数据进行以刷卡账号为分组依据分别统计其刷卡次数和平均刷卡消费金额,得到7792人的相关信息,这也与该校的在校生人数基本相符,然后画出其散点图如图2所示。
从统计数据可知,在图2中有5521名学生在食堂就餐的次数低于每天2次,即λ取值为2,根据前面的假设,这部分学生对于计算并无意义,将这些学的数据进删除后只剩下2271名学生的消费情况。将这些学生的平均消费金额进行统计后得到如下的图3所示。
从图3可以看出,平均每次刷卡消费的金额主要集中在1元至4元之间,整体基本满足正态分布。
因为全部学生人数为7792人,经过清洗后剩余学生2271人,按全体学生的5%来挖掘特困学生,则应找出389名学生,其占经过去噪处理后2271名学生的17.1%。根据图1可知, γ≈0.89,经过统计可知2271名学生的单次消费均值μ为2.382元,方差σ为0.634元,因此,根据(5)式可得特困学生的判定模型为
f(xi)=1,Ni≥142且μi≤2.382-0.562
0,其它(6)
最后使用散点图显示(6)式的特困学生判定结果如图4所示。
在图4中红色横线以下部分,共394人即为挖掘出来的特困学生。经过与该校学生资助管理中心提供的2014年5月全校特困学生数据对比,发现特困学生的判定正确率为82.6%。另有2.79%共11人新挖掘出的特困生经过核实确认为原未被认定的特困学生。同时发现了该校某学院2011级预科有一名非常特殊的学生,其平均每天的生活费用为6.06元。后经调查核实,该生的确因家庭情况特殊,生活费用非常有限。
五、结语
本文针对当前特困学生的认定中存在的问题,利用学校食堂后台的学生刷卡消费记录,利用正态分布理论构建了特困学生的挖掘模型,为特困学生的认定工作带来科学的决策数据,取得了一定的成果。但是,由于高校中男女生在饮食上消费的特点不同、体育等体能消耗较大的专业学生也有不同的较大的区别,这些都将是下一步需要研究的内容。
参考文献:
[1]黄永斌.新形势下高校贫困生认定及资助模式探析[J].合肥工业大学学报(社会科学版),2010(02).
[2]毕鹤霞,沈红.贫困生判定的难点与认定方法探究[J].高校探索,2008(05).
[3]葛超.论高校贫困生认定工作中的难点及对策[J].中国电力教育,2012(02).
[4]岑道权.高校贫困生认定的难点及对策探析[J].陕西理工学院学报(社会科学版),2007(04).
*基金项目:贵州省2014年大学生创新创业训练计划项目(20141066801)。
(作者单位:贵州工程应用技术学院。张仕学为本文通讯作者)
关键词:食堂刷卡记录;正态分布;特困学生
一、引言
随着高等教育的发展,贫困地区和贫困家庭的孩子进入大学人数越来越多,据教育部的统计数据,截至2013年,全国高校贫困学生已经达到500余万,高校中的贫困学生比例已经高达20%,其中特困学生的比例达到总在校人数的5%以上。贫困生的资助工作也成各高校的一项重要的学生工作。
由于种种原因,各高校在贫困学生的认定和资助工作中,还存在很多问题。
1. 高校学生的贫困认定一般以学生在户籍所在地村委、乡镇政府或民政部门出据的相关证明材料为主要的依据之一,而这些证明材料中的数据往往以相关人员的主观为主,缺乏可信度。
2. 特困和一般贫困的界限不清楚,很多学校以划分比例或设定名额的方式进行“推选”,从而使特困生的认定结果在不同院系存在很大差异,最终认定的特困生不一定特困,而真正特困的学生有可能没有被发现。
3. 很多学生为了获得资助每当进行贫困认定时就哭穷,却拿着贫困资助的钱去进行请客吃喝等非贫困的消费,而学生相关部和老师每年只是按程序进行了相关贫困生的认定和资助工作,对特困学生的日常生活方面缺乏较合理的跟踪手段,不能及时发现真假特困生。
然而,学校食堂是学生在校期间的主要餐饮消费场所,信息时代学生的餐饮消费被全部记录,而学生食堂的消费最能体现学生的消费情况,并反映到该学生的经济情况。
二、研究现状
贫困生的认定工作是高校贫困生资助中最重要的工作之一,贫困的认定标准制定、认定流程和认定方法等都有不少学者进行了研究。黄永斌提出了高校自身认定法、在校消费水平认定法和综合认定法等三种方法;毕鹤霞等将校园判定与生源地判定相结合的方法,构建了贫困生的判定体系;葛超从贫困生证明真假难辨、贫困生的认定标准难以制定和认定方法的不科学性等三个方面分析的贫困生认定工作的难点,同时提出了完美相关法制、建立贫困生信息共享平台和改进贫困生认定手段等机制和措施;岑道权将学生的生活费支出、家庭人均收入、缴纳学费等方面相结合来完美贫困生的资助体系;肖蕾等从学生家庭真实经济情况、学生的人际关系对贫困认定的影响、国家无偿资助造成学生骗取资助现象等方面提出了完美家庭经济情况的审核、加强诚信教育和诚信档案建设,改变无偿性资助的现状等有效措施。
以上这些研究主要从贫困生的认定困难性、贫困生认定的判定体系和贫困相关政策等方面进行了研究,而尚无从所有学生中发现真正的贫困学生的研究成果。
陈晓等利用高校中的学生信息、学生家庭成员信息、学生家庭经济状况信息、成绩信息、月消费信息、助学贷款信息和贫困生申请表等学生多方面的信息,构建加权约束的决策树,用于提高贫困生的认定效率。该作者的研究综合了高校中几乎与学生有关的信息偷出,综合考虑学生的所有情况,但就学生的真正贫困情况而言并不具体深入。
综合以上情况,本文将以学生食堂消费记录为依据,采用正态分布理论,构建基于学生食堂消费记录的特困学生挖掘模型,从学生日常的餐饮消费记录中挖掘出真正需要资助的特困学生,也可以从中发现假的特困学生。为高等学校的特困学生认定和资助提供科学的参考依据。
三、特困生挖掘模型
由于高等学校是开放式办学,学生在校期间相对比较自由,因此学校并未要求学生必须要去学校食堂就餐,为挖掘特困学生,由于校外消费均远高于校内学生食堂,所以,假设特困学生绝大多数时间都在学校食堂就餐。
为衡量学生在学校食堂就餐的情况,列出单个学生在校就餐消费均值、全体学生食堂就餐消费均值和方差的定义。
定义1:设全校共有M个学生在食堂就餐,学生xi在校食堂总消费次数为Ni,每次消费金额为hi,单个学生的消费均值记为μi,全体学生的消费均值记为μ,全体学生的消费方差记为μ则有
μi=hi(1)
μ=Ei(2)
σ2=(μi-μ)2(3)
为了界定特别困难学生与其它学生的区别,列出学生消费阈值的定义。
定义2:设食堂消费记录采样天数为N,把学生的消费次数阈值记为N0,则有
N0=λN(4)
其中λ表示均值消费次数阈值系数,用于限制只有在食堂消费次数达到一定数量的学生才参与贫困生的判定。
为了使用离群点的理论来研究特困学生的挖掘方法,下面给出离群点的定义。
假设每个学生就餐的消费均值服从正态分布(如图1所示),记为N(μ,σ2),从图中可以看出,X轴上μ左右两侧各1σ 间的面积为68.27%,各 1.96σ间的面积为95.00%,各2.58σ间的面积为99.00%。
定义3:根据正态分布规律,将低于全体学生均值γσ的部分学生定义为特困学生。
根据(1)、(2)、(3)、(4)式和定义3,设学生xi每月在食堂消费的次数为Ni,每次的平均消费额为ui,则可构建特困学生判定模型如下:
f(xi)=1 Ni≥N0且μi≤μ-γσ
0 其它(5) 上述式中,f(x)=1表示学生x为特困学生,f(x)=0,则表示该学生不是特困学生。
四、实验分析
根据实验需要,某普通高等学校食堂后台采集到2014年2月26日至5月8日共71天的学生就餐刷卡记录739029条,由于食堂消费普通不高,因此先将单次消费高于20元的记录作为噪声去掉,经过去噪后有效记录为737252条。
预处理后的数据进行以刷卡账号为分组依据分别统计其刷卡次数和平均刷卡消费金额,得到7792人的相关信息,这也与该校的在校生人数基本相符,然后画出其散点图如图2所示。
从统计数据可知,在图2中有5521名学生在食堂就餐的次数低于每天2次,即λ取值为2,根据前面的假设,这部分学生对于计算并无意义,将这些学的数据进删除后只剩下2271名学生的消费情况。将这些学生的平均消费金额进行统计后得到如下的图3所示。
从图3可以看出,平均每次刷卡消费的金额主要集中在1元至4元之间,整体基本满足正态分布。
因为全部学生人数为7792人,经过清洗后剩余学生2271人,按全体学生的5%来挖掘特困学生,则应找出389名学生,其占经过去噪处理后2271名学生的17.1%。根据图1可知, γ≈0.89,经过统计可知2271名学生的单次消费均值μ为2.382元,方差σ为0.634元,因此,根据(5)式可得特困学生的判定模型为
f(xi)=1,Ni≥142且μi≤2.382-0.562
0,其它(6)
最后使用散点图显示(6)式的特困学生判定结果如图4所示。
在图4中红色横线以下部分,共394人即为挖掘出来的特困学生。经过与该校学生资助管理中心提供的2014年5月全校特困学生数据对比,发现特困学生的判定正确率为82.6%。另有2.79%共11人新挖掘出的特困生经过核实确认为原未被认定的特困学生。同时发现了该校某学院2011级预科有一名非常特殊的学生,其平均每天的生活费用为6.06元。后经调查核实,该生的确因家庭情况特殊,生活费用非常有限。
五、结语
本文针对当前特困学生的认定中存在的问题,利用学校食堂后台的学生刷卡消费记录,利用正态分布理论构建了特困学生的挖掘模型,为特困学生的认定工作带来科学的决策数据,取得了一定的成果。但是,由于高校中男女生在饮食上消费的特点不同、体育等体能消耗较大的专业学生也有不同的较大的区别,这些都将是下一步需要研究的内容。
参考文献:
[1]黄永斌.新形势下高校贫困生认定及资助模式探析[J].合肥工业大学学报(社会科学版),2010(02).
[2]毕鹤霞,沈红.贫困生判定的难点与认定方法探究[J].高校探索,2008(05).
[3]葛超.论高校贫困生认定工作中的难点及对策[J].中国电力教育,2012(02).
[4]岑道权.高校贫困生认定的难点及对策探析[J].陕西理工学院学报(社会科学版),2007(04).
*基金项目:贵州省2014年大学生创新创业训练计划项目(20141066801)。
(作者单位:贵州工程应用技术学院。张仕学为本文通讯作者)