论文部分内容阅读
在高校扩招政策的影响下,各高校的学生人数不断扩大,这给高校的管理者和管理模式提出了更高的要求,所以各高等学校纷纷采用了数字化和信息化的管理手段。比如教学管理信息系统、学生选课系统、学生就业管理信息系统等在各大高校得到了广泛的应用。随着已毕业学生人数的增加,毕业生基础数据库积累的数据越来越多,在这些数据深处隐藏着一些我们管理者在数据表面无法观察到的重要的信息。本文以北京工商大学嘉华学院的往届毕业生的数据作为挖掘对象,利用数据挖掘技术从北京工商大学嘉华学院毕业生基础数据库里提取出隐含的、未知的知识。数据挖掘技术能够预测事物未来的发展趋势和行为,能够显现出现有数据和结果之间的隐性联系,使我们能作一些知识驱动的预先决定。在挖掘算法上,关联规则是当前数据挖掘研究的主要模式之一,侧重于确定数据中不同领域之间的关系,找出满足给定支持度和可信度阈值的多个域之间的依赖关系。但是如果只是基于原始的Apriori算法进行多维关联规则挖掘会产生大量的候选频繁项目集。目前很多基于规则进行归纳数掘挖掘系统的基础都是决策树归纳方法,所以本文用了关联规则挖掘和ID3挖掘两种算法。应用决策树归纳算法生成决策树后,从决策树的根结点到叶结点的一条路径就形成了对相应对象的类别预测。以这些类别预测为基础,进行强关联规则分析进而得到有效的结果,决策树算法可以清晰的显示哪些字段比较重要,更直观的发掘学生各信息之间的联系。运用决策树算法对毕业生数据进行数据挖掘,是为了找出影响学生就业的主要因素,同时寻找能够有助于北京工商大学嘉华学院(独立学院)毕业生就业的有效途径,有助于提高对毕业生就业指导的实效性,同时改变就业指导方法、培养模式和教学计划,适应市场需求,提高学生的就业率。经过对大量的毕业生数据进行挖掘,发现学生的综合成绩、英语成绩、毕业论文成绩、实践成绩较好的人一搬会进入国有经济类型的单位,另外可以看出综合成绩、英语成绩、毕业论文成绩、社会实践成绩较好的男同学且是党员的选择深造的可能性较大。最后,将数据挖掘的结果运用学生的管理和教育教学中,着重培养学生的英语、专业知识水平和社会实践能力,适应市场需求,为社会培养合格的人才。