论文部分内容阅读
数据挖掘技术是在海量数据中进行有用信息提取的重要有效手段。通过数据挖掘,人们可以从大量数据中获取感兴趣和有用的信息。目前,数据挖掘技术已经在商业等领域进行了广泛的应用。然而,其应用范围不仅仅局限于此。通过了解我们可以发现,数据挖掘技术在教育领域的应用相对较少,尤其在学科质量评价体系中的应用更为稀缺。所以,本文通过对学科相关数据的搜集整理和挖掘,给出了一套行之有效的科学评估手段,从而为学科之间横向和纵向的评比提供了参考依据,并对学科的建设和发展提供了相关的指导意见。为了实现建立一套科学可行的学科评价体系的目的,我们尝试利用数据挖掘的相关知识进行研究,其中主要应用到了经典的决策树分类算法:ID3算法,以及关联规则中的Apriori算法。本文中我们对Apriori算法进行了使用,并给出了一套基于这两种算法的学科评价体系方法。第一章主要介绍数据挖掘的国内外研究背景及现状,提出学科评价的理论意义以及实现学科评价系统的实用价值。第二章从学科评价的相关知识入手,对本文要研究的问题进行简要的阐述。第三章中首先详细介绍了数据挖掘中的相关概念以及应用到的技术。对数据挖掘的任务、过程、基本的分类聚类方法,常用的挖掘技术等方面进行了简要阐述和说明;然后以ID3决策树算法和Apriori关联规则算法为切入点,详细探讨了数据挖掘的具体算法,分析如何在属性选择度量采取信息论中熵的概念,以及如何对决策树进行剪枝;最后以购物车问题为例,对关联规则进行了相关阐述,介绍了支持度和置信度的概念,并就Apriori算法进行了相关描述。第四章对数据挖掘在学科质量评价体系中的应用设计和实现过程进行介绍,其中本文重点完成了对相关数据的预处理过程,设计了两个数据挖掘模型,实现了数分类处理的工作。第五章中主要总结和讨论了在学科评价领域中应用数据挖掘相关知识的可行性,并对在实现学科评价系统过程中产生的不足之处加以分析且提出了后续意见,希望对今后的研究工作起到指导作用。