论文部分内容阅读
由于数据库中存在着大量数据,因此从数据库中发现有用的信息显得十分重要。数据挖掘技术就是为解决这个问题而产生的.对数据挖掘技术的研究,国内外己经取得了许多令人瞩目的成就,并成功地应用到了许多领域,但在教育领域中的应用并不广泛。
由于我国大众化高等教育的普及,高等院校招生规模的扩大,高校学生数量的激增,学生就业问题日益突出,各高校千方百计提高就业率,除了加强自身的办学条件,高校的决策者很想知道如何培养学生能够提高就业率。
高校一般都已建立了学生管理系统,保存有大量的学生就业历史数据。如何从这些数据中找出有用的信息,提供给决策者,是我们所关心的问题。本文应用数据挖掘技术,建立学生就业信息库,完整地实现了数据分类挖掘的全过程,包括:确定数据挖掘对象及目标、采集数据、采用数据集成、数据清理、数据转换、数据消减等数据预处理技术;根据就业数据具有分类的预知性与离散性的特点,选择决策树C4.5算法,生成决策分类树,并利用事后修剪法对决策树进行修剪:最后由决策树产生分类规则,完成了学生就业分析决策树模型的建立,挖掘出学生就业的若干规律。