论文部分内容阅读
近年来随着高校的不断扩招,学生人数大幅度增加,给高校学生管理、教学工作带来了严峻考验,传统的教学管理手段已逐渐不能适应社会的发展。随着数据挖掘技术的成熟及应用领域的不断扩展,不少高校研究人员已开始研究将数据挖掘技术应用于高校的教学、管理中。
1 学生成绩管理的重要性
考试是教育活动中评价教学质量,衡量教学效果,鉴别人才素质的重要手段之一。其中学生成绩管理涉及到教学以及管理等工作中的许多环节,因此,成绩管理的好坏决定了高校的教学质量。而成绩是对学生在校期间学习质和量的一个全面综合性评价,所以成绩管理的科学化对学生的个人成长及发展起着促进的作用。提高学生成绩管理的科学化,对高校教学改革也是具有指导作用的,从而让高校的培养模式能够按照科学化的方式进行。成绩管理有其自身的特点:①复杂性。成绩管理是对在校学生成绩评定、记载和反馈的过程管理,信息处理量大,具有相对的复杂性;②时效性。成绩是学生和家长最关心的问题,学生希望在很短的时间内了解到本人的成绩状况,以便进行相应的决策,如选课、补考和重修准备等;③公平性和准确性。学生成绩不但是对学生进行综合测评和评定奖学金的重要依据,也是学生毕业和就业的基本依据和重要保障。因此,加强成绩管理,不仅有利于激发学生的学习积极性,使学生把学习作为一种自觉的行为,促进学风的转换;而且也有利于促进教风学风建设。
2 成绩管理面临的问题
目前,在高校管理中,特别是在对学生的成绩管理工作中,普遍存在的问题是学生成绩数据量过于庞大。但目前对这些数据的处理还停留在初级的数据备份、查询及简单统计阶段,对于学生取得这些成绩的原因往往无法了解,使得这些数据还不能发挥它应有的作用。如何利用这些数据理性地分析教学中各方面的成效得失以及找到有关影响学生学习成绩的因素是广大教师们都共同关心的问题。
3 利用数据挖掘技术管理学生成绩
数据挖掘是一种决策支持过程,是深层次的数据信息分析方法。将数据挖掘技术应用于对学生成绩的分析无疑是非常有益的,它可以全面地分析考试结果与各种因素之间隐藏的内在联系,比如:经过对学校学生成绩相关数据库系统的分析。数据挖掘工具可以回答诸如“哪些因素对学生的学习成绩可能有影响”等类似的问题。这是传统评价方法无法具备的。
(1)挖掘的步骤
第一步:确定挖掘对象和目标。清晰地定义出问题,认清数据挖掘的目的是数据挖掘的重要一步。
第二步:模型的选定。为所挖掘的问题选择合适的数据挖掘方法,然后,针对该挖掘方法选择一种算法,而算法的选择直接影响着所挖掘模式的质量。
第三步:数据采集。这是一个工作量较大,占据时间较多的一个阶段。需要在以往的教学实践中,注意收集数据信息,有些数据的产生可以直接获得,有些数据需要对学生进行调查获得。
第四步:数据预处理。这一步是将收集到的不同的数据信息预处理为一个分析数据模型,这一数据模型是针对算法而准备的,不同的算法可能需要不同的分析数据模型。
第五步:数据挖掘。这一步是算法的具体实现,即对所得到的经过预处理的数据进行挖掘。
第六步:结果分析。这一步主要解释和评估结果。
第七步:知识的应用。这一步是将分析所得到的知识集成到教师的教学环节中去,教师可利用所得知识改进教学策略,指导进一步教学。
(2)决策树算法对学生成绩的分析
决策树算法是以实例为基础的归纳学习算法,通常用来形成分类器和预测模型,可以对未知数据进行分类或预测、数据预处理、数据挖掘等。它通常包括两部分:树的生成和树的剪枝。
从决策树提取分类规则时,规则使用“if…then”的形式表示出来,对从根到树叶的每一条路径创建一条规则,沿着路径上的每一个属性值对,形成规则前件(“if”部分)的一个合取项。叶节点包含类预测,形成规则后件(“then”部分)。“if…then”规则易于理解,特别是当给定的树很大时,而且便于规则匹配等操作。
(3)应用粗糙集理论对学生成绩分析
粗糙集是一个强大的数据分析工具。它能表达和处理不完备信息,能在保留关键信息的前提下对数据进行化简,并求得知识的最小表达方法,能识别并评估数据之间的依赖关系,揭示出概念简单的模式,能从经验数据中获取易于证实的规则知识。粗糙集理论是针对不确定性问题提出的,它的特点是不需要预先给定某些特征或属性的数量描述,而是直接从给定问题的描述集合出发,通过不可分辨关系和不可分辨类确定给定问题的近似域。从而找出该问题的内在规律。
利用粗糙集理论中的属性重要性分析方法来分析学生的成绩,由于粗糙集理论是在没有任何先验假设的情况下对数据进行分析,因此,其得出的结论更符合实际情况。利用粗糙集的算法,借助于计算机,可以对更大量的数据(有时称为海量数据)进行分析,从而可以进行更为全面和客观的预测与决策。而我们大学教学中,不但经常要接触大量的数据,而且也拥有许多重要的数据。如果我们能利用粗糙集理论对这些数据进行处理和分析,分析的结果将会对某门课程的教学提供大量有用的信息,从而使我们的教学迈上一个新台阶。
4 总结
在教育考试领域,越来越多的考试信息使用了计算机进行处理和存放,大大减少了手工处理工序和存储空间,提高了存储的安全性和便捷性。这样就存在了大量的各种考试的数据,如何根据不同考试的要求和特征,找出这些考试数据中存在的必然联系和潜在的关系已经成为各种考试管理机构的必然需求。
1 学生成绩管理的重要性
考试是教育活动中评价教学质量,衡量教学效果,鉴别人才素质的重要手段之一。其中学生成绩管理涉及到教学以及管理等工作中的许多环节,因此,成绩管理的好坏决定了高校的教学质量。而成绩是对学生在校期间学习质和量的一个全面综合性评价,所以成绩管理的科学化对学生的个人成长及发展起着促进的作用。提高学生成绩管理的科学化,对高校教学改革也是具有指导作用的,从而让高校的培养模式能够按照科学化的方式进行。成绩管理有其自身的特点:①复杂性。成绩管理是对在校学生成绩评定、记载和反馈的过程管理,信息处理量大,具有相对的复杂性;②时效性。成绩是学生和家长最关心的问题,学生希望在很短的时间内了解到本人的成绩状况,以便进行相应的决策,如选课、补考和重修准备等;③公平性和准确性。学生成绩不但是对学生进行综合测评和评定奖学金的重要依据,也是学生毕业和就业的基本依据和重要保障。因此,加强成绩管理,不仅有利于激发学生的学习积极性,使学生把学习作为一种自觉的行为,促进学风的转换;而且也有利于促进教风学风建设。
2 成绩管理面临的问题
目前,在高校管理中,特别是在对学生的成绩管理工作中,普遍存在的问题是学生成绩数据量过于庞大。但目前对这些数据的处理还停留在初级的数据备份、查询及简单统计阶段,对于学生取得这些成绩的原因往往无法了解,使得这些数据还不能发挥它应有的作用。如何利用这些数据理性地分析教学中各方面的成效得失以及找到有关影响学生学习成绩的因素是广大教师们都共同关心的问题。
3 利用数据挖掘技术管理学生成绩
数据挖掘是一种决策支持过程,是深层次的数据信息分析方法。将数据挖掘技术应用于对学生成绩的分析无疑是非常有益的,它可以全面地分析考试结果与各种因素之间隐藏的内在联系,比如:经过对学校学生成绩相关数据库系统的分析。数据挖掘工具可以回答诸如“哪些因素对学生的学习成绩可能有影响”等类似的问题。这是传统评价方法无法具备的。
(1)挖掘的步骤
第一步:确定挖掘对象和目标。清晰地定义出问题,认清数据挖掘的目的是数据挖掘的重要一步。
第二步:模型的选定。为所挖掘的问题选择合适的数据挖掘方法,然后,针对该挖掘方法选择一种算法,而算法的选择直接影响着所挖掘模式的质量。
第三步:数据采集。这是一个工作量较大,占据时间较多的一个阶段。需要在以往的教学实践中,注意收集数据信息,有些数据的产生可以直接获得,有些数据需要对学生进行调查获得。
第四步:数据预处理。这一步是将收集到的不同的数据信息预处理为一个分析数据模型,这一数据模型是针对算法而准备的,不同的算法可能需要不同的分析数据模型。
第五步:数据挖掘。这一步是算法的具体实现,即对所得到的经过预处理的数据进行挖掘。
第六步:结果分析。这一步主要解释和评估结果。
第七步:知识的应用。这一步是将分析所得到的知识集成到教师的教学环节中去,教师可利用所得知识改进教学策略,指导进一步教学。
(2)决策树算法对学生成绩的分析
决策树算法是以实例为基础的归纳学习算法,通常用来形成分类器和预测模型,可以对未知数据进行分类或预测、数据预处理、数据挖掘等。它通常包括两部分:树的生成和树的剪枝。
从决策树提取分类规则时,规则使用“if…then”的形式表示出来,对从根到树叶的每一条路径创建一条规则,沿着路径上的每一个属性值对,形成规则前件(“if”部分)的一个合取项。叶节点包含类预测,形成规则后件(“then”部分)。“if…then”规则易于理解,特别是当给定的树很大时,而且便于规则匹配等操作。
(3)应用粗糙集理论对学生成绩分析
粗糙集是一个强大的数据分析工具。它能表达和处理不完备信息,能在保留关键信息的前提下对数据进行化简,并求得知识的最小表达方法,能识别并评估数据之间的依赖关系,揭示出概念简单的模式,能从经验数据中获取易于证实的规则知识。粗糙集理论是针对不确定性问题提出的,它的特点是不需要预先给定某些特征或属性的数量描述,而是直接从给定问题的描述集合出发,通过不可分辨关系和不可分辨类确定给定问题的近似域。从而找出该问题的内在规律。
利用粗糙集理论中的属性重要性分析方法来分析学生的成绩,由于粗糙集理论是在没有任何先验假设的情况下对数据进行分析,因此,其得出的结论更符合实际情况。利用粗糙集的算法,借助于计算机,可以对更大量的数据(有时称为海量数据)进行分析,从而可以进行更为全面和客观的预测与决策。而我们大学教学中,不但经常要接触大量的数据,而且也拥有许多重要的数据。如果我们能利用粗糙集理论对这些数据进行处理和分析,分析的结果将会对某门课程的教学提供大量有用的信息,从而使我们的教学迈上一个新台阶。
4 总结
在教育考试领域,越来越多的考试信息使用了计算机进行处理和存放,大大减少了手工处理工序和存储空间,提高了存储的安全性和便捷性。这样就存在了大量的各种考试的数据,如何根据不同考试的要求和特征,找出这些考试数据中存在的必然联系和潜在的关系已经成为各种考试管理机构的必然需求。