论文部分内容阅读
随着高校的发展以及扩招,导致学生数量猛增,学生的就业也逐渐成为一个严峻的问题。另一方面各高校已经建立了各种信息系统,用于管理海量数据,但是,面对这些数据,我们仅能进行简单的查询、增加等操作是不够的,如果能够从高校掌握的海量数据中发现一些规律,并利用这些规律辅助决策的制定这对学校的发展起着至关重要的促进作用。数据挖掘技术使这个构思能够付诸实施。其中关联规则算法是如何从这些数据中提取有用的信息,并使它们形成利于决策的知识,应用于高校的就业指导和教学改革的决策中,以便增强高等院校的竞争力和学生的就业率。为解决以上高校所面临的实际问题,本文依据我院近几年积累的就业相关数据,对其进行关联规则的数据挖掘,旨在找到一些能对就业指导和专业设置、课程改革起到辅助作用的知识,使之成为决策者的参考依据。具体所做工作为:首先介绍了数据挖掘的工作过程,以及数据挖掘结果的应用,接着详细讨论了关联规则数据挖掘方法的执行步骤;其次在介绍了已有的Apriori算法及其适用范围和局限性,提出了一个利用代价敏感的非频集过滤矩阵寻找k-频集构造过滤矩阵的算法,该算法是一个代价敏感的算法,第一步,进行代价敏感学习,第二步,利用非频集过滤矩阵生成k-频集,第三步,生成强关联规则,第四步,生成非频集过滤矩阵Apriori算法所需的初始矩阵,第五步,构造代价敏感的非频集过滤矩阵,第六步,根据非频集过滤矩阵判断是否存在满足条件的k-频集的方法;然后就新算法的性能表现做了多方面比较分析;最后是改进算法的设计与实现,通过分析和实验验证该算法的应用效果。将基于代价敏感的非频集过滤矩阵的Apriori算法应用到高职院校就业分析系统中,以此指导学生就业,进行课程和专业的改革和建设,从而达到提高就业率的目的,并对应用新算法数据挖掘前后的就业数据统计证明:新的就业数据挖掘算法具有可行性和有效性,执行效率较高,算法执行减少了遍历次数和扫描记录数。