论文部分内容阅读
作为选拔人才的主要形式,考试在我们生活中时常发生,从学生时代到职业生活,考试成绩都是衡量我们能力的重要指标。尤其是在中学时代,大到升学考试,小至随堂测验,海量的成绩数据充斥在学生和教师之间,但是教师和学生对成绩的使用仅限于一些简单的描述性统计结果,这不管是对于这种数据资源的浪费,还是对于教师管理学生,甚至是学生自主学习,都缺少了科学、全面、有针对性的及时的建议。所以,找到一种使适用范围广,操作简单,有学习能力的数据挖掘技术来对学生成绩分析,给出潜藏在繁杂冗余数据背后的有用信息,变得十分迫切。本文选用了贴近人类思维的基于t-范数的模糊推理模型来对数据进行处理,借助统计功能强大的R语言,调用R包解决了模糊聚类、模糊推理和多元回归的实施过程。本文首先对中学生三次考试成绩进行了模糊c-均值聚类和k-means聚类(三种距离)并把4个类归结于优、良、中、差4个等级;针对每一个类别进行了特征刻画,得到总体分布,各类别里的学生具体特点,并结合类别差异讨论;得出每类学生具体优势学科和短板学科,以便老师作出针对性教学。将四个聚类结果进行加权平均计算出总成绩各类分布情况,对之进行分析,发现有些学生的类别和成绩分布之间存在小部分交叉,约占10%,针对这部分学生作为特殊人群做出警示,重点观察。最后从3阶段的类别变化项分析,结合特殊人群班级分布情况,综合讨论类与班级的关系。从以上多角度讨论,实现了总成绩整体类别的分析,文科、理科综合成绩的分析,并对其中的异常数据关注,做好警示处理。在处理了成绩分布的基础上,使用基于T(r)模糊推理下模型和回归分析分别对下一阶段无干预状态下的成绩进行了预测;对比两种预测成绩结果后,将两者加权平均作为最终预测结果,并将九年级预测成绩与其他两阶段成绩进行对比分析,找出可能的特殊人群,并对这些有风险的学生给出有针对性的教学指导与学习上的建议,使得学生能够及时进行调整。