论文部分内容阅读
随着信息社会的发展,数据挖掘技术越来越受到信息产业界和整个社会的关注。对数据挖掘技术的研究,国内外已经取得了许多令人瞩目的成就,并成功地应用到了许多领域。本文主要研究如何将数据挖掘技术应用到高校就业指导工作中。文章用数据挖掘中的决策树工具挖掘不同行业就业毕业生特质,从而来提高毕业生的就业竞争力,这在目前将数据挖掘技术与就业指导工作结合进行定量定性分析的应用中有一定的创新。
当今社会,大学生就业成为了全社会关注的热点,我国大学生就业的结构性矛盾仍然突出,有效需求不足,毕业生增长过快。今后一段时间内,我国大学生就业总量大、增速快、增幅高和有效需求增长滞后的矛盾突出,需要解决的问题很多,高校从事就业工作的业内人士需要在就业困难时期深入研究、探索,在实践中不断总结,提高工作能力。
数据挖掘的对象是某一专业领域中积累的数据;挖掘过程是一个人机交互、多次反复的过程;挖掘的结果应用于该专业指导实际工作。数据挖掘的整个过程都离不开应用领域的专业知识。
本文尝试用数据挖掘的方法对毕业生的基本数据进行挖掘,从而探索如何改变目前我国高校以通过简单的统计方法处理毕业生数据为主的现状,为高校的决策者提供教学改革的参考意见,并引导大学生进一步提高就业竞争力。
本文选择上海财经大学作为示例,展示如何在高校就业指导工作中应用数据挖掘工具。本文对该校2008年本科毕业生基本信息构建决策树模型。第一步,比较数据挖掘的各种技术,分析高校毕业生信息库的特点。从而选择最合适的数据挖掘技术来解决问题。第二步,收集2008年本科毕业生数据,建立数据集,并对收集的数据进行预处理。第三步,用成熟的SPSS Clementine工具中决策树C5.0模型,对清洗后的数据集进行建模分析。模型将本科毕业生的就业行业流向作为决策树的输出,将毕业生的个人信息、成绩信息、就业意愿信息等作为输入,通过比较分析剪枝和不剪枝的决策树模型来挖掘发现不同行业就业的学生特质。第四步,抽取2009年本科毕业生基本信息来验证该模型的可靠性和可移植性,并对其进行评价。第五步,将模型提取的规则应用于毕业生求职行业的预测,并指出研究成果对高校就业指导工作及教学改革的意义和作用。
文章在用决策树分析时有所创新,从决策树的另外一个角度--不剪枝的决策树--成功提取所需规则。文章通过分析不剪枝的决策树分析毕业生行业就业的“非主流”分支及“小概率事件”,让学生看到求职中自己的优势和弱势,从不同的角度分析毕业生就业的行业特质,为毕业生提高就业竞争力提供参考意见。
除此之外,模型还结合了当前经济形势和学生求职价值取向,发掘学校应引导毕业生适当加强的地方,为学校办学提供参考;最后,在一定的前提下,该模型还能为本科毕业生行业求职可能性进行预测,让学生充分了解自己求职过程关键成功因素,从而有的放矢地提高自己的就业竞争力。