聚类分析与判别分析在高校贫困生认定中的应用

来源 :科学时代·下半月 | 被引量 : 0次 | 上传用户:ywg005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘要] 基于高校贫困生认定时不同高校贫困生情况不同的事实,本文利用系统聚类分析和Fisher判别分析将全国典型的60所高校分为了五类,并得到了每一类高校的判别函数,以此对我国其余高校进行分类。通过每类高校贫困生特征的总结,论文很大程度上提高了高校贫困生认定的准确性,优化了国家贫困生资助体系,为当前高校贫困生认定工作提供科学依据。
  [关键词] 贫困生认定 高校分类 聚类分析 Fisher判别分析
  [Abstracts] After investigating the different situations 60 schools have faced in identifying financially strapped students, the various situations were classified into five categories using Cluster Analysis and Fisher Discriminant Analysis, the discriminant function of each category was acquired, and the rest Chinese schools were categorized following the functions. The advantages of the discriminant function is that, by summarizing the traits poor students possess, the profoundly promoted identifying accuracy, a optimized national financial aid system, and a scientific foundation in each school's works on poor students nowadays will be achieved.
  [Key words] Identification of Strapped Students Categorization of schools Cluster AnalysisFisher Discriminant Analysis
  
  1.当前我国贫困生认定现状与对策分析
  1.1我国当前贫困生认定工作状况
  胡锦涛总书记在中国共产党第十七次全国代表大会上的报告中指出:“教育是民族振兴的基石,教育公平是社会公平的重要基础。”近年来,随着我国高等教育不断发展,特别是收费制度改革和招生规模逐年扩大,高校贫困生问题逐渐成为高校发展中的一个重大问题。现行高校贫困生资助体系存在诸多问题,特别是贫困生认定工作表现尤为突出。现行高校贫困生认定主要采取学生生源地认定和高校相关认定标准相结合的方法,此方法存在一定问题,如:部分证明材料方面的真实性无法核实;认定组织者对政策理解存在偏差;认定程序没有统一标准、随意性大,缺乏科学性,主观因素影响较大等。
  总的来看,现行高校贫困生认定方法过分依赖直观的表面现象和人际因素,操作不规范,从而导致了认定工作出现“误判”和“错判”,严重影响了教育资助的利用效益,损害了真正贫困学生的切实利益。笔者认为,做好贫困生认定工作是从根本上解决高校贫困生问题的一个最重要环节。所以,建立一种客观公正、科学合理的贫困生认定制度,提高贫困资助的有效性,是摆在我们面前亟需解决的问题。
  1.2高校分类对贫困生认定具有重要意义
  高校是国家资助体系的执行单位,并且与贫困生认定情况密切相关。基于此,论文首先对全国众多高校进行分类,找出每一类高校中贫困生特征,并根据这些特征建立一套适合该类高校的客观公正、科学合理的贫困生认定制度,从而提高贫困生认定的准确性。所以,以贫困生认定为主要目标的高校分类是非常必要的。
  2.系统聚类分析模型的建立
  聚类分析与判别分析是现代多元统计学的重要分支,是研究将对象按照多个方面的特征进行综合分类的一种多元统计方法。其可以有效避免传统分类方法的主观性和片面性并解决科学研究中多样本、多指标的分类问题。本文利用聚类分析和Fisher判别分析解决高校分类问题,为后续贫困生认定提供科学依据。
  2.1高校的选取与指标体系的建立
  2.1.1 高校选取[1]
  对高校进行分类,首先要从全国高校中选择具有代表性的高校。为了筛选高校的可操做性,笔者首先由高校密集地区的人均GDP和地理位置等要素将全国分为五大地区:经济很发达地区、经济发达地区、经济较发达地区、经济一般地区、经济不发达地区。从这五个地区中选取高校的原则是使每一所高校都能尽量代表与其同程度的其他高校,即高校要具有代表性。高校选取所参考的标准是①高校类别②高校本次③高校管理单位④高校所在城市。根据以上原则和标准,论文选出了全国具有代表性的60所高校。
  2.1.2 指标体系建立
  我国高校信息化及其指标体系研究还是一个相对较新的领域,基本处于探索阶段,缺乏一套系统的理论支持。虽然高校信息化建设是当前高校建设中的重要组成部分,但信息产业部门并没有建立起全国统一信息化指标体系,缺乏数据来源和数据可信度。基于所选指标的科学性、合理性和可操作性以及数据来源和数据可信度、搜集数据难易程度等原则,笔者参照现行高校贫困生界定标准,通过一些间接指标来达到对高校分类的效果,选取了如下表一所示的高校分类指标。
  第一类,高校基本信息:高校本次,高校管理单位,高校是否是211或985工程院校。通过这些指标,我们可以了解高校性质,掌握其收费情况和资金雄厚程度,从而解决在贫困生认定过程中高校应拿出多少资金资助多少贫困生的问题。
  第二类,高校所在城市基本信息:高校所在城市级别,高校所在城市居民最低生活保障线,高校所在地最低工资标准。这些指标反映了高校所在城市性质、规模、特点、职能、交通等,可间接了解高校所在地区生活消费、教育水平、经济状况以及贫困现状。
  第三类,高校主要生源(高校所在省)基本信息:高校主要生源地人均GDP和物价消费指数CPI。通过这些指标,可以了解和把握高校所在地区经济发展状况和当地人民生活水平以及饮品、住宅、衣着、教育、交通、医疗和娱乐等其他商品及物价情况,从而了解高校所在地的消费水平和发达程度。由此解决了在贫困生认定过程中,对于跨地区贫困生的界定。
  表一 高校分类指标
  高校基本信息 本次 x1
   管理单位
   是否是985或211工程院校
  高校所在城市基本信息 城市级别 x2
   居民最低生活保障线 x3
   最低工资标准 x4
  高校主要生源地基本信息 人均GDP x5
   CPI x6
  
  由于高校基本信息属于定性指标,笔者利用层次分析法(AHP)将其进行了量化处理,并合为一个指标。
  2.2定义距离
  设,,…,表示高校分类指标,表示第所高校第个指标的观测值。
  (1)数据变换处理
  为消除原始数据量纲不一致的影响,笔者选用标准化变换,令,分别表示第个指标的样本均值观察值和样本方差观察值,即
  ①
  (2)样品间距离定义
  根据高校指标特性,笔者将高校之间的距离定义为欧氏距离,即
   ②
  越小,表明两所高校性质越相近,可归为一类。
  (3)类间距离定义
  设把所高校分为类,表示第类高校。表示第类中的高校个数,是的中心,则中高校的离差平方和为
  ③
  越小,说明高校分类越合理。
  2.3系统聚类分析的步骤
  (1)根据公式①,对高校指标,,…,进行标准化处理,得到标准化数据。
  (2)根据公式②,计算所高校两两间的距离,构造距离矩阵,记为。
  (3)把距离最近的两所高校聚为一类,其他高校各自为一类,共聚成类。
  (4)根据公式③④,计算新类与当前各类的距离,将距离最近的两类进一步聚成一类,共聚成类。重复执行以上步骤,最终将所有高校聚成一类并画出聚类谱系图。
  (5)根据高校分类数,得出每一类所包含的高校,并对各类做出合理的解释。
  3. 高校分类实现。
  利用MINITAB15统计分析软件可以得到具体分类。摘取部分程序执行结果如下:
  
  谱系图如下
  
  由聚类结果可以将高校分为五类。
  4. Fisher判别分析模型的建立
  判别分析是在已知研究对象分成若干类并已取得各类一批已知样本观测数据的基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析。常用的判别方法有距离判别法、Fisher判别法、Bayes判别法和逐步判别法,本文选用Fisher判别法。
  4.1建立判别函数
  设高校分成类从每类中抽取的高校数分别为高校总数,设判别函数为:
   , ④
  记。
  根据Fisher判别准则有:
  (1)不同类尽可能远离。
  各类间的离散程度用类间离差平方和表示为:
  ⑤
  其中为类高校指标的平均值,
  
  为所有类高校指标的总平均值,
  
  (2)同类中各样本尽可能靠近。
  同类高校中各高校间的离散程度可表示为:
  
  则总类内离差平方和为:
  ⑥
  (3)由Fisher准则,建立目标函数
   令 ⑦
  为求的最大值,根据极值存在的必要条件,令可得
  ⑧
  求出的最大值及其所对应的特征向量,即为所求判别系数,进而可建立Fisher判别函数为:
  
  4.2确定临界值
  利用判别函数求出各类的平均指标值:
  
  然后将按由小到大顺序排列:
  
  每相邻两新类高校之间取加权平均值为:
  ⑨
  将作为第和类间的判别临界值。
  4.3检验规则
  将一个新高校的观测值带入判别函数,求出其相应的指标值
  若,则判(新1类)
  若,则判(新类)
  若,则判(新1类);若,则判(新类);
  5 .高校分类判别函数的求解
  在上面,已经将高校分成5类,为了得到这五类高校的判别函数,再次利用MINITAB15进行Fisher判别分析,部分程序执行结果如下:
  
  
  由上面的判别分析结果我们可以看到,应用判别分析对系统聚类分析得到的5种分类结果进行交叉验证的正确率达到96.7%,说明系统聚类分析对高校的分类是十分准确的,同时也反映了Fisher判别分析所得到的判别函数是准确的。由MINITAB15得到五类高校的判别函数分别为:
  第一类:
  第二类:
  第三类:
  第四类:
  第五类:
  6. 结果分析
  6.1五类高校判别特点分析
  经过聚类分析与Fisher判别,60所高校被分成了五类,每一类高校都应有一种与其相对应的贫困生评定规则,下面我们分别根据这五类高校指标特点分析其相对应的贫困生具有的特点。
  第一类高校指标数据特点表明,该类高校全部位于经济发达的一线城市,故此类高校贫困生生活消费水平也较高,在认定此类贫困生时,其认定标准应该是这五类高校中最简单的。由于高校所在地具有雄厚的经济实力,所以当地政府应适当提高资助金额。
  第二类高校基本上位于经济较发达的一线和二线城市,个别位于经济较发达的三线城市,最低生活保障线也较高。此类高校基本上全是国家重点大学,且大部分具有很强的综合实力,所以此类高校可以拿出一部分资金资助本校贫困生,再加上国家的资助,可以加大贫困资助的力度。
  第三类高校全部位于经济较发达的一线和二线城市,且基本上是省会城市,最低生活保障线和人均GDP也较高。但是此类高校基本上全是二本或三本院校,学校的综合实力相对比较弱,学校在贫困生资助中可能拿不出一定资金资助贫困生,所以国家应着重加大生资助力度。
  第四类高校基本上位于二线和四线城市,但这些城市大部分位于经济欠发达且物价消费指数也较高的偏远地区。此类学校综合实力基本相当,而且比较弱。所以这类高校中的贫困生认定标准比前三类都低,国家和当地政府应给予一定程度上的资金支持,资助范围应要比前三类高校更大一些。
  第五类高校全部位于其所在省的六线城市,此类高校综合实力很弱,主管单位基本上是个体单位,学校很少能够拿出资金资助贫困生。所以此类高校贫困生认定标准是这五类中最复杂的,国家和当地政府要加大对此类高校中贫困生的资助力度。而且这类高校贫困生数目也是最多的,考虑到高校所在地区的生活消费水平比较低,可以适当减少个体资助金额来扩大资助范围。
  6.2误差分析与不足之处
  本文虽然利用聚类分析和判别分析成功实现了对全国60所高校的分类,但是这种分类也存在一定的误差与不足。首先,在样本的选取上,这60所高校并非全是最典型的,但鉴于全国高校众多,不可能对所有的高校进行考察。其次,在高校指标的选取方面,我们考虑到数据收集的可操作性,选取了部分能间接反映高校特征的指标,这种间接性的指标对高校特征的描述可能不如直接性指标的效果好。系统聚类法和判别分析法有多种,论文只是选取了其中的一种,可能不同种方法的分类结果会有所不同。所以,这就要求我们在应用聚类分析和判别分析时,要根据具体的问题综合考虑各个方面,最终选用适用于该问题的方法。
  7 .小结
  高校贫困生经济上的困难不仅给贫困生群体自身的发展和健康成长带来了影响,增大了人才培养的压力,还将影响到高校的稳定和发展。本文利用科学合理的数学方法对高校进行分类,提高了贫困生认定的准确性,为高校建立学生资助体系提供了基础,对促进教育公平与均等、维护校园的稳定和社会的和谐发展有着重大意义。
  参考文献:
  [1]李卫东.应用多元统计分析[M],北京:北京大学出版社 ,2008,109-180.
  [2]马逢时,吴诚鸥,蔡霞.基于MINITAB的现代使用统计[M],北京:中国人民大学出版社,2009,46-94.
  [3]王平,赵人可,彭朝晖.运用聚类分析法对我国企业信贷风险的评估与预测[J],数学理论与应用第30卷第一期92-97,2010年3月.
  [4]余锦华,杨维权.多元统计分析与应用[M],广州:中山大学出版,2005,137-150.
  [5]胡雷芳.五种常用系统聚类分析方法及其比较[J],经济研究.
  [6]陈双梅.当前高校贫困生认定工作存在的问题及对策[J],中国电力教育,2008年8月上,总第142期.
  作者简介:
  闰从山(1985-),男,油气储运工程专业毕业,现为副科级纪检监察员。
  舒小立(1980-),女,硕士研究生,主要从事大学生思想政治工作。
  注:
  西南石油大学2010年校级科技基金项目编号 2010XJR043
  
  “本文中所涉及到的图表、公式、注解等请以PDF格式阅读”
其他文献
[摘要] 新校的建成使我校进入了运用现代教育技术辅助教学的全新时代,为了真正了解现代教育技术的运用状况以及它在提高课堂教学实效性上的作用,学校组织了一次规模性的问卷调查活动。问卷分“教师卷”和“学生卷”,从答卷情况看,三分之二的师生是认真的,反映了真实情况。通过对选择题数据统计分析和问答题答案的综合分析,我们总结出了四个方面的经验和启示,供今后参考借鉴。  [关键词] 问卷调查的意义 组织 结果的
期刊
[摘要] 在社会信息化的大趋势下,业务IP化和承载网IP化也推动着基础传送网的演进,然而,目前运营商的现状是以太网机、路由器等多个网络分别承载不同业务、各自维护的局面,难以满足多业务统一承载和降低运营成本的发展需求。因此,城域网需要采用灵活、高效和低成本的分组传送平台来实现全业务统一承载和网络融合,分组传送网(PTN)由此应运而生,本文结合SDH存在的问题,介绍了PTN在城域网建设中应用及案例。
期刊
[摘要] 课程体系和教学内容直接反应教育目的和培养目标,是养成人才素质、提高教育质量的核心环节,在这个意义上,高等学校课程体系与教学内容创新是整个教学改革的重点和难点。高等教学改革要获得成功,必须从课程体系和教学内容入手。本文着重论述了高等学校课程体系和教学内容创新的意义、原则、策略和创新过程中需要处理好的几对关系。  [关键词] 高等学校 课程体系 教学内容 创新    随着国际国内经济形势的新
期刊
[摘要] 传统的新闻价值定义与要素,过于书面和笼统,不便把握与操控。把“你最想知道的正是我正在播报的”引入新闻与传播价值领域,探寻、发现并实现新闻价值、传播价值的最大化,做好3G时代的广播电视传播,是有积极意义的。  [关键词] 新闻价值新概念 满足使用与服务 科学传播    如何放大新闻价值路径  按照“我最想知道的就是你正在播报的”要求,当前,应在“观念求变、视野求宽、角度求新、思辩求深、手法
期刊
[摘要] 成长是人生的母题。从哲学意义来说,每个人无时无刻不在成长。成长包括两个层面的内涵:首先是生理层面的,指的是作为个体的人所经历的童年、少年、青年、壮年这样一个生命生长发育的自然流程;其次是心理或精神层面的,意味着个体存在的趋向成熟,有较明确的自我意识,能协调个人和社会规范之间的冲突,从而在一定程度上实现自我价值。在文学创作巾,成长一般不是生理层面的生长发育,而是指心理或精神层面的成熟过程。
期刊
[摘要] 2000年9月12日,体育彩票在安徽全面上市,随着时间的推移和玩法的深化、多样化,彩票销售市场逐步形成并规范化,销量逐年增长,但面临的问题也逐步呈现:城市终端饱和,网点形象不规范逐步显现弊端,宣传缺乏特点及针对性,管理水培落后等。这些问题所引发的结果向安徽体彩的发展提出了挑战。如何改进城市体彩的工作,是体彩人面临的新课题。  [关键词] 城市体彩管理 形象建设 宣传培训    调查显示,
期刊
[摘要] 报纸版面是新闻内容的载体与表现形式,它反映出一张报纸的整体水平和质量,是一张报纸个性和风格的直观表现。党报的版面创新,要着力实现内容和形式的和谐统一,在版式设计中充分体现舆论导向和新闻价值,形成报纸的整体风格和文化品位,以提高党报的引导力、影响力、感染力和吸引力。  [关键词] 党报 版面 创新 策略    在一张白纸上赋予于政治、经济、文化、艺术等生命内涵,编辑形成简洁明快、生动活泼、
期刊
【摘 要】城市生态水系的建设应从城市建设的实际需要出发,从谋求可持续发展的人居环境的大趋势考虑,反映出人类社会发展的历史必然,应体现未来城市发展的方向。  【关键词】城市;生态;水系
期刊
【摘 要】户外广告设置已在诸多城市的经营实践中进行了广泛探索,并取得了较好的经济和社会效益。户外广告作为直接影响视觉感受的城市重要设施之一,体现着城市发展水平和文明程度,是城市文化传播的重要载体。  【关键词】户外广告;禁止设置区;控制设置区;一般设置区  前言  户外广告设置已在诸多城市的经营实践中进行了广泛探索,并取得了较好的经济和社会效益。城市主管部门深刻认识到广告档次的高低,直接影响着城
期刊
【摘 要】锡伯图灌区田间工程渠道改造工程断面形式采用梯形断面,有效地利用了原渠道工程量,有效地降低了渠道工程造价。  【关键词】渠道改造;梯形断面方案;应用与分析
期刊