论文部分内容阅读
随着高等教育改革的不断深入,高等教育日益普及,高校毕业生数量逐渐增加,如何应对高校毕业生在就业过程中日渐暴露出的各种问题,不仅需要高校毕业生的综合素质的提高,同时对高校就业指导部门的决策能力是一种考验。针对这一现状,如何制定相对应的就业指导方针,是当下每个高校都需要考虑的问题。从实现高校信息化建设以来,很多高校保存了大量的毕业生就业数据,这些数据作为毕业生信息留档或者必要时的数据统计,其中的有效信息并未被挖掘出来,信息利用率太低。本文采用数据挖掘中的决策树技术,对毕业生的信息进行挖掘,探究毕业生信息和毕业生就业去向之间的关联,为高校的就业指导部门在制定毕业生就业指导方针时提供一个好的理论支持。从海量数据中进行数据提取、挖掘,从而发现隐藏在数据中的有利用价值的信息和知识,这个过程被称为数据挖掘。数据挖掘技术涵盖多种算法,包括:决策树算法、神经网络算法、关联规则算法、统计分析方法和模糊集方法等。本文依据毕业生数据的特点,通过分析基于修正函数和属性优先值的改进ID3算法,引入了修正系数的概念,从算法的时间复杂度和准确度方面进行优化,并通过实例验证,改进的ID3算法更适用于毕业生数据挖掘。本文针对某省属院校计算机科学与工程学院近五年的毕业生信息,从中提取、挖掘以前未被发现的有价值信息,利用就业分析系统,从而实现了数据挖掘。此过程包括:明确数据挖掘目的以及对象、信息收集和数据集成、数据清理、数据变换等数据预处理技术,紧接着选择基于修正系数的改进ID3算法,生成决策分类树,最后用决策树产生分类规则,建立毕业生就业分析模型,挖掘出与毕业生就业相关的若干规律。本文工作对帮助高校更好的进行毕业生就业指导,使就业指导部门作出正确的分析与决策,提高高校毕业生就业质量有重大的意义。