论文部分内容阅读
数据挖掘是过去十年来信息技术最活跃的领域之一。相对于学术领域的蓬勃发展,数据挖掘在现实世界中的应用并没有像学术领域那般活跃。这一切违背了数据挖掘的原意和本质。数据挖掘最终目的是帮助各类主体推进各自领域的研究和业务。我们现在并不处于越来越多需要算法的阶段,我们需要的是在现实世界中应用它们,在各个领域深入推动它的应用研究。教育领域各方面的数据正在快速地增长。这些海量的教育信息数据收集、存放在了各式各样的数据容器中,越来越多的教育研究和实践工作者将研究重心转移到如何将这些庞大的数据快速转换为有用的信息上来。在了解数据挖掘历史以及教育领域相关应用的基础上,受到商业智能的启发,本文提出了“教育智能”的概念,即基于教育领域知识驱动的数据挖掘应用,以此为契机,期望该领域的应用研究能够蓬勃发展起来,最终融入教育研究方法体系。本文主要工作包括以下三个部分:首先,全面分析国内外教育领域(包括移动学习领域)数据挖掘应用研究的现状,介绍了数据挖掘的概念和方法论,简要阐述了数据挖掘的主要分析方法,列举了常见的数据挖掘工具并论述了数据挖掘工具的主要评价因素。在这个基础上,受商业智能的启发,提出了教育智能概念,并论述了教育智能与教育统计之间的区别与联系。其次,在移动学习这一教育情境下,进行移动学习数据的挖掘与分析,以两个案例的形式展现移动学习领域知识驱动的数据挖掘应用。运用决策树技术研究移动学习的性别差异案例中基于移动学习实践中获取的大样本原始实验数据,使用C5.0算法生成男女生群体关于课件满意度的决策树,然后比较从中提取的不满意规则进行性别差异研究。运用聚类分析方法评估片段式学习资源的应用情况案例中,基于课程知识点进行片段式学习资源的设计与开发,试验性地应用于移动学习中,在学习者完成一个阶段的学习后,使用网上问卷调查的形式收集学习者的反馈信息,引入数据挖掘技术,对大规模数据进行聚类分析,得到聚类结果,进而从各类型学习者的特征属性和类间的变化规律出发,分析研究片段式学习资源在移动学习中的可行性和具体设计策略,并提出实施建议。最后,在移动学习系统的基础上,基于CRISP-DM模型设计与实现了一个时序预测Web服务,对网站资源的点播下载需求量进行预测。重点阐述了CRISP-DM模型应用于时序预测任务时的设计思想和实现的关键技术。测试结果表明,该时序预测Web服务具有较高的预测准确率,部署快速,使用方便,对解决同类问题具有一定的示范和参考价值。