论文部分内容阅读
21世纪是知识经济时代,也是社会各个领域特别是教育全面信息化的时代,教育信息化水平和数字化教学资源的有效占有量已成为衡量一个国家或地区教育现代化进程的重要标志,是21世纪教育的生命线。教师只能通过简单的统计或排序等功能获得表面的信息,由于缺乏信息意识和技术,隐藏在这些大量数据中的信息一直没有得到应用。如何对这些数据进行重新利用,将现有的数据转化为可使用的知识,提高学校管理决策性和办学质量,是很多学校正在考虑的问题。数据挖掘是解决数据丰富而知识贫乏的有效途径,其实质是从大量数据中提取隐含的、未知的和潜在有用信息的过程。其在分析大量数据中具有明显优势,并已成功地应用到了多个研究领域,但在教育领域中应用还不够深入。本文通过对数据挖掘技术的相关分析与比较,将数据挖掘技术与统计分析相结合:采用基于总结规则的统计分析,完成学生成绩的对比、分析,实现试卷质量评价报告的生成,对教师改进教学,提高试卷质量将起到积极作用。同时,数据挖掘技术有各种模式,如关联分析、分类和预测及聚类等。各种模式各有侧重,且其中有些已经研究得较为成熟,研究成果也较多。而将这其中的几种模式作为另一种模式的数据预处理方式来进行数据挖掘,目前还尚未见到相关的应用研究。本文将聚类分析和粗糙集理论中的属性约简引入数据挖掘的数据预处理过程之中,使学生成绩这一连续属性值离散化且消除调查问卷中的冗余属性,以便对数据集进行之后深层次的关联规则挖掘,确定学生平时表现及其相关信息与期末考试成绩之间的关联关系,找出影响学生成绩的潜在因素。在使用工具上,纵观以往相关的应用研究,基于总结规则的统计分析往往是借助SAS或SPSS软件的统计分析功能来加以实现的;而数据挖掘技术则多借助Visual Basic、Visual C++、Visual Foxpro、Delphi或SQL Server2000中的数据挖掘功能等来加以实现。本文统一采用MATLAB为工具以真正实现对学生成绩分析的一体化。