论文部分内容阅读
摘 要:21世纪信息化飞速发展的高校,我们已经使用先进的手段和方法来搜集大量与学生成绩有关的数据资料,但未能从大量的数据仓库中去挖掘出隐藏的具有价值的数据。在过去的几年里,我们正是为了满足这种需求,不断的寻找,找到了发现知识(KDD)及其核心技术。本文阐述了数据挖掘的有关定义及使用方法、概述了数据挖掘的主要任务、技术方法,重点阐述了数据挖掘在高校教育实习评定中的分析,以及当前在高校教育实习评定中所面临的挑战。
关键词:数据挖掘;数据仓库;高校;教育实习;评定
中图分类号:TP311.13
数据是知识发现的源泉。在高速发展的信息时代,数据存储技术也得到了飞速发展。随着人们收集的数据量不断增大,加上数据本身就具有信息量较大的特点,我们根本不能使用传统的数据分析工具和技术来进行处理。有时也因数据本身的一些非传统的因素,不能使用传统的数据分析方法和技术来进行处理。在需求的迫使下,我们需要开发新方法,数据挖掘就是为顺应这种需要应运而生发展起来的主要数据处理技术。目前,数据挖掘技术已在商务、医学、市场营销、卫生、金融、科学与工程、互联网语言的识别等众多领域广泛使用,且在这些领域已获得令人叹为观止的效果[1]。
与此同时,数据挖掘技术被更多的应用在高校的教务管理、学生信息成绩、图书馆管理等系统中,这不仅对学生的管理提供了奖惩帮助,改进现有的培养机制和教学计划,还可以为高校图书馆的个性优质化服务提供决策依据。本文探讨的是数据挖掘在高校教育实习评定中的分析,由于所蕴含的数据仓库与教育实习密切相关的大量有价值的信息未得到发现和利用,导致了找不到提高学生教育实习评定的突破口。
1 数据挖掘的有关概念及使用方法
首先,需要弄清楚数据仓库和数据库的概念。数据仓库就是数据的仓库,它将大量数据有效的存储和管理起来,提供有效的数据访问手段。数据库存储的是及时数据,而数据仓库存储的是历史数据。数据仓库与数据库两者不是同一概念,如图1所示。
图1 数据仓库与数据库的区别
其次,需要理解知识发现和数据挖掘。数据挖掘又称为知识发现(KDD)。数据挖掘是在大型的数据库里去寻找和发现你所感兴趣的或者你认为有价值的信息的过程,而数据库中知识发现(KDD)是将还没有经过加工的数据从数据数据库中转变成极为有用的信息的全过程[2]。如下图2所示。
图2 数据库中知识发现(KDD)过程
最后,分清数据仓库、数据挖掘、知识发现(KDD)三者的关系。数据仓库是一个通过一系列处理、加工、整合的数据库,数据仓库是数据挖掘的对象,数据仓库提供挖掘的数据。知识发现(KDD)是一种知识发现的一连串程序,而数据挖掘是数据库中知识发现(KDD)中的一个小步骤。怎样才能从繁冗的数据仓库中挖掘出我们认为值得去探究的信息,已成为当务之急。
数据挖掘汇聚了数据库、人工智能、可视化、运筹和统计学、生物遗传学等不同领域的专家和学者。主要运用了人工神经网络法、决策树分类算法、机器学习搜索、统计分析法、遗传等算法。其主要使用方法,是通过数据来建立模拟真实世界形态的模型,通过模型来描述和预测数据中的模式及之间的相互关系,为我们作决策时提供依据。例如,关联规则模型可以帮助我们找到提高学生的教育实习评定的方法。还可以让我们通过数据模式帮我们作出预测,例如我们可以指定具有较高综合素质的老师上教育专业课程,预测出哪些能影响学生教育实习评定的数据。通常,数据挖掘有以下几种常用模型:回归、时间序列、分类、聚类、顺序和关联。回归和分类模型主要用于预测,关联和时间序列主要用于描述行为,聚类两者通用[3]。
1.1 回归。回归分析是一组通过确定两种或两种以上变量之间相互依赖的定量关系的分析方法和定量预测方法之一。它使用的是一系列现有的数据来预测一个连串数据的可能值。通常采用的是一元回归线性分析和多元线性回归模型来进行分析。
1.2 时间序列。在大多数的问题中,随机的数据都是按照实践的先后顺序排列的,称为时间序列。用现有的数值来预测未来的数值,分析的数值都与时间有关,是一种动态数据处理统计方法。
1.3 分类。是最基本的任务。每次考试完成我们都对学生的成绩进行优良中差的分类,教师授课质量进行分类等等。如何理解数据挖掘中的分类概念?是根据变量进行计算,再依据结果建模然后再对未分类的数据进行分类预测。
1.4 聚类。就是把数据各个不相同的个体分割为具有更加多相似性的多组子集,目的为了更好的找出组与组之间存在的差异及相似性。“物以类聚,人以群分”就是这个道理。它与分类的不同在于,进行聚类前并不知道将要划分成几个组和什么样的组,也不知道根据什么方式和根据来区分和分类。当前,聚类技术正在蓬勃发展,涉及范围包括数据挖掘、统计学、机器学习、空间数据库技术、生物学以及市场营销等领域,聚类分析已经成为数据挖掘研究领域中一个普遍的课题。
1.5 顺序规则,顺序规则有点类似于关联规则,不同在于顺序规则中相关的事件是以时间区分,而顺序规则是以先后来区分。
1.6 关联。关联是用来发现事物之间相互联系的规则。用它来发现数据中相互关联的特征,找出某一时间或数据会同时出现的东西。在市场营销领域被广泛的运用,例如,“尿布与啤酒"的故事”,“购物篮数据分析”等等。我们通过这一规则可以发现数据之间出现交叉的机率,从而找出数据与数据之间关联度大小。
2 数据挖掘的主要任务
首先,分类分析。分类就通常认识事物时往往先把被认识的对象进行分类,以便寻找其中同与不同的特征。也可以利用训练数据集通过一定的算法而求得分类规则。例如根据教育专业中学生的理论成绩、普通话成绩、试讲成绩等判断学生的实习综合评定。主要是对学生实习综合评定的预测。
其次,聚类分析。聚类是把收集好的数据按照相似性归纳成若干类,同一类中的数据相似,不同类中的数据不相似。聚类划分的是未知的类,分类划分的是已知的类。将学生教育实习中的普通话、试讲成绩性质相近的归为一类,将英语、数理化成绩差别较大的归入不同的类,从而发现这些成绩与教育实习评定之间的相互关系。 最后,关联分析。关联分析是指如果两个或多个事物之间存在一定的关联,那么其中一个事物就能通过其他事物进行预测。它的目的是为了挖掘隐藏在数据间的相互关系。教育实习的评定就是通过关联分析,让我们了解教育实习的评定与普通话成绩和理论成绩以及试讲成绩密切相关。普通话成绩不好的成绩必定会影响试讲成绩,试讲成绩和理论成绩不好的成绩必定会影响教育实习的评定。这类发现的规律或知识可以帮助高校教育专业的老师制定出针对教育实习的教学管理方案,同时及时加以调整。
3 数据挖掘的主要技术方法
根据数据挖掘的方法,可分为以下几种[4]:
3.1 人工神经网络。神经网络是模拟神经系统执行的简单模型。由基本单元(神经元)组成,这些基本单元以简化的方式模仿自然界发现的生物神经元行为。
3.2 决策树。将已有的数据按照某个特定的目标变量,每一次分割会把不同种类的总体分割成小的、更为相似的群组。
3.3 关联规则。要求数据挖掘者要有准确的直觉,因为关联表述了现实的产品和服务是如何组合练习在一起的。
3.4 遗传算法。是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局优化概率搜索算法。具有计算简单、优化效果好的特点,它在处理组合优化问题方面也有一定的优势,可用于聚类分析等。
3.5 联机分析处理(简称OLAP)。针对特定问题的联机数据访问和分析。通过对信息的观察形式进行快速、稳定一致和交互性的存取[5]。
3.6 K近邻算法。K最近邻(k-Nearest Neighbour,KNN),是最简单的机器学习算法之一。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别最近邻技术通过k个与之最相近的历史记录的组合来辨别新记录。KNN算法不仅可以用于分类,还可以用于回归[6]。
3.7 可视化。它采用直观的图形图表方式将挖掘出来的模式表现出来,支持多维数据的可视化,为数据分析人员提供很好的帮助。可视化技术这是一类辅助方法。
4 高校教育实习的概述
教育实习是高校师范教育专业中必不可少的实践环节,也是师范教育专业的必修课程,更是提高师范教育专业学生素质和技能的重要途径之一。高校教育实习的目的在于使师范专业的学生进一步巩固和运用所学的专业理论知识、教育理论知识和基本技能,在具体的教育和教学实践中得到锻炼,初步掌握备课规律、教学方法和教学工作的基本程序;使学生更深刻地认识到人民教师工作的光荣与历史使命,进一步树立忠诚党的教育事业的专业思想。同时,通过教育实习使学生走向社会接触本专业工作,拓宽知识面,锻炼学生综合运用所学的基础理论、基本技能和专业知识,提高实践动手能力,为师范专业的学生毕业后走上工作岗位打下一定的基础;同时可以检验教师的教学效果,为进一步提高教育教学质量,培养合格人才积累经验。因此,学生进行教育实习有着十分重要而深远的意义。
5 高校教育实习评定在数据挖掘中的分析
第一,认真的对待学生教育实习的教学与实践教学的设计。学生在校期间的学习课程大多都是相辅相成的,并且在课程与课程之间会有一定的关联性和前后顺序的关系。如果同学们之前所有的基础课程没有学好,那么后续的课程学习势必就会受到影响。除此之外,也存在一些情况。同一年级不同班级的学生学习同一门课程,也会因讲授课教师以及班级水平层次、同学自身文化水平、班级的学习氛围的不同,最后导致本次教育实习评定级别会相差非常大。结合往届参与教育实习学生的理论考试成绩、试讲成绩、普通话成绩、粉笔字成绩、板书成绩,运用数据挖掘的关联及序列分析等技术方法,就能从这些大量的数据中寻找出有价值的信息,通过分析得到许多有实效的规则和信息,利用这些规则和信息找出影响学生教育实习评定的最终因素,在此基础上不断调整和合理安排高校学生教育实习教学的相关课程。
第二,对教育专业学生及教师特征进行的数据挖掘。学校人事管理数据仓库和学生成绩系统里记录着教师及学生的学习及工作学习基本情况、社会活动、奖励处罚等的情况,使用数据挖掘的关联分析可以寻找教师的综合素质与学生成绩内在的联系。在实际情况中,教师的学历和教龄较高的时候,同专业同班级学生求学兴趣浓厚,班级学习氛围较好的情况下,就能关联分析出该专业该班级学生学习成绩良好以上的可能性。同时也可以根据学生的学习偏好以及班风、班干的带头作用等已知的信息来挖掘,帮助我们进行判断与事先制定好的行为目标来进行预期的比较,从如何提高学生的自主学习能力入手,帮助他们德、智、体、美全面和谐的发展。
第三,教师课堂教学质量的评估。教师课堂教学质量的好坏直接关系到学生课堂听课的质量,因此学生需要对教师课堂教学质量进行评估。高校会在每学期期中教学检查的时候,发一份教师课堂教学质量的评估表给抽样的学生来进行教师课堂教学质量进行评估。除了学生的评教之外,还需要有常规的教师自查评分(教学日历执行情况、出勤情况、课前准备情况、作业情况、课外辅导情况等)以及教研室主任听课评分(思想表现、教学态度、教学内容、教学方法、教学效果)。通过对教学质量评估数据库中的数据进行挖掘,挖掘教师教学态度、教学水平、教学方法、教学效果等四大主要项数据间有无必然的关联性。学生的评教评估表上的总分和最后评价等级可以反映出上同一课程教师课堂教学质量综合水平。通过评估表上学生对评估的该教师提出的不足,加上该教师的自查自评以及教研室主任听课评分能让决策者的我们更加合理快速的调整教学计划安排,改进授课教师的教学方式和方法,让学生能够保持良好的学习心态和积极性,提高整个班级的学习氛围。
第四,教师评学。学生评教是教师教学课堂质量的重要指标之一,那么教师评学是学生学习行为判定的唯一指标。要对教育专业的学生进行评学,首先确定授课教师的职称、学历,授课性质等指标。通过上课迟到评分、旷课情况评分、课堂纪律评分、课前预习和课后巩固评分、作业完成情况评分、课堂交流评分、班干部作用评分、与其他上课班级相比评分、与同课程的上届班级相比评分、班主任与您联系次数评价等这些重要的数据指标得分得到一些反馈信息。利用数据挖掘技术来对上述的数据指标进行分析,可以及时得到学生学习行为的评价结果,对于学生在校学习期间出现的不良的学习行为加以及时有效的纠正,让学生在校学习期间得到身心健康的发展。 6 数据挖掘在高校教育实习中面临的挑战
6.1 由于数据产生和收集技术的不断进步,数据挖掘算法要处理这些海量数据集,则算法必须是可伸缩的。可伸缩可能还需要实现新的数据结构,以有效的方式访问个别记录。
6.2 具有时间或空间分量的数据集也趋向于具有很高的维度。为低维数据开发的传统的数据分析技术通常不能很好地处理这样的高维数据。
6.3 传统的统计方法基于一种假设—检验模式。当前的数据分析任务常常需要产生和评估成千上万的假设,因此希望自动地产生和评估假设导致了一些数据挖掘技术的开发。面对庞大的数据, 现有的统计方法都遇到了问题,,于是人们对数据进行抽样。如何抽样,抽取多少样本,又怎样评价抽样的效果, 这些都是值得我们去探讨和研究[7]。
7 结束语
数据挖掘作为一个多学科交叉的新兴学科,在研究领域和商业领域得到了显著的成效。近几年,数据挖掘也被引入到高校的管理中,通过挖掘学生成绩等蕴含的信息,来分析判断与课程及授课教师之间的关系。利用这样的方法,可以更便捷的为高校的决策者在高校教育管理方面作出调控决策。
参考文献:
[1][美]Pang-Ning Tan Michael Steinbach Vipin Kumar.数据挖掘导论[M].2006,05.
[2](美)Michael J.A.Berry Gordon S.Linoff.数据挖掘技术:市场营销、销售与客户关系管理领域应用[M].2006,07.
[3]谢邦昌.数据挖掘Clementine应用实务[M].2008,04.
[4]李波.数据仓库与联机分析处理(OLAP)技术[J].北京广播学院学报:自然科学版,2005(12).
[5]基于度量学习的邻域k凸包集成方法[J].合肥工业大学学报:自然科学版,2013,2(05).
[6]赵岩.数据挖掘理论与技术[J].福建电脑,2006(02).
[7]张莉.数据挖掘技术及应用现状[J].中国石油大学胜利学院学报,2008(06).
作者简介:郭佳(1983-),本科学历,助教,研究领域:数据挖掘技术。
作者单位:桂林电子科技大学计算机科学与工程学院,广西桂林 541004
关键词:数据挖掘;数据仓库;高校;教育实习;评定
中图分类号:TP311.13
数据是知识发现的源泉。在高速发展的信息时代,数据存储技术也得到了飞速发展。随着人们收集的数据量不断增大,加上数据本身就具有信息量较大的特点,我们根本不能使用传统的数据分析工具和技术来进行处理。有时也因数据本身的一些非传统的因素,不能使用传统的数据分析方法和技术来进行处理。在需求的迫使下,我们需要开发新方法,数据挖掘就是为顺应这种需要应运而生发展起来的主要数据处理技术。目前,数据挖掘技术已在商务、医学、市场营销、卫生、金融、科学与工程、互联网语言的识别等众多领域广泛使用,且在这些领域已获得令人叹为观止的效果[1]。
与此同时,数据挖掘技术被更多的应用在高校的教务管理、学生信息成绩、图书馆管理等系统中,这不仅对学生的管理提供了奖惩帮助,改进现有的培养机制和教学计划,还可以为高校图书馆的个性优质化服务提供决策依据。本文探讨的是数据挖掘在高校教育实习评定中的分析,由于所蕴含的数据仓库与教育实习密切相关的大量有价值的信息未得到发现和利用,导致了找不到提高学生教育实习评定的突破口。
1 数据挖掘的有关概念及使用方法
首先,需要弄清楚数据仓库和数据库的概念。数据仓库就是数据的仓库,它将大量数据有效的存储和管理起来,提供有效的数据访问手段。数据库存储的是及时数据,而数据仓库存储的是历史数据。数据仓库与数据库两者不是同一概念,如图1所示。
图1 数据仓库与数据库的区别
其次,需要理解知识发现和数据挖掘。数据挖掘又称为知识发现(KDD)。数据挖掘是在大型的数据库里去寻找和发现你所感兴趣的或者你认为有价值的信息的过程,而数据库中知识发现(KDD)是将还没有经过加工的数据从数据数据库中转变成极为有用的信息的全过程[2]。如下图2所示。
图2 数据库中知识发现(KDD)过程
最后,分清数据仓库、数据挖掘、知识发现(KDD)三者的关系。数据仓库是一个通过一系列处理、加工、整合的数据库,数据仓库是数据挖掘的对象,数据仓库提供挖掘的数据。知识发现(KDD)是一种知识发现的一连串程序,而数据挖掘是数据库中知识发现(KDD)中的一个小步骤。怎样才能从繁冗的数据仓库中挖掘出我们认为值得去探究的信息,已成为当务之急。
数据挖掘汇聚了数据库、人工智能、可视化、运筹和统计学、生物遗传学等不同领域的专家和学者。主要运用了人工神经网络法、决策树分类算法、机器学习搜索、统计分析法、遗传等算法。其主要使用方法,是通过数据来建立模拟真实世界形态的模型,通过模型来描述和预测数据中的模式及之间的相互关系,为我们作决策时提供依据。例如,关联规则模型可以帮助我们找到提高学生的教育实习评定的方法。还可以让我们通过数据模式帮我们作出预测,例如我们可以指定具有较高综合素质的老师上教育专业课程,预测出哪些能影响学生教育实习评定的数据。通常,数据挖掘有以下几种常用模型:回归、时间序列、分类、聚类、顺序和关联。回归和分类模型主要用于预测,关联和时间序列主要用于描述行为,聚类两者通用[3]。
1.1 回归。回归分析是一组通过确定两种或两种以上变量之间相互依赖的定量关系的分析方法和定量预测方法之一。它使用的是一系列现有的数据来预测一个连串数据的可能值。通常采用的是一元回归线性分析和多元线性回归模型来进行分析。
1.2 时间序列。在大多数的问题中,随机的数据都是按照实践的先后顺序排列的,称为时间序列。用现有的数值来预测未来的数值,分析的数值都与时间有关,是一种动态数据处理统计方法。
1.3 分类。是最基本的任务。每次考试完成我们都对学生的成绩进行优良中差的分类,教师授课质量进行分类等等。如何理解数据挖掘中的分类概念?是根据变量进行计算,再依据结果建模然后再对未分类的数据进行分类预测。
1.4 聚类。就是把数据各个不相同的个体分割为具有更加多相似性的多组子集,目的为了更好的找出组与组之间存在的差异及相似性。“物以类聚,人以群分”就是这个道理。它与分类的不同在于,进行聚类前并不知道将要划分成几个组和什么样的组,也不知道根据什么方式和根据来区分和分类。当前,聚类技术正在蓬勃发展,涉及范围包括数据挖掘、统计学、机器学习、空间数据库技术、生物学以及市场营销等领域,聚类分析已经成为数据挖掘研究领域中一个普遍的课题。
1.5 顺序规则,顺序规则有点类似于关联规则,不同在于顺序规则中相关的事件是以时间区分,而顺序规则是以先后来区分。
1.6 关联。关联是用来发现事物之间相互联系的规则。用它来发现数据中相互关联的特征,找出某一时间或数据会同时出现的东西。在市场营销领域被广泛的运用,例如,“尿布与啤酒"的故事”,“购物篮数据分析”等等。我们通过这一规则可以发现数据之间出现交叉的机率,从而找出数据与数据之间关联度大小。
2 数据挖掘的主要任务
首先,分类分析。分类就通常认识事物时往往先把被认识的对象进行分类,以便寻找其中同与不同的特征。也可以利用训练数据集通过一定的算法而求得分类规则。例如根据教育专业中学生的理论成绩、普通话成绩、试讲成绩等判断学生的实习综合评定。主要是对学生实习综合评定的预测。
其次,聚类分析。聚类是把收集好的数据按照相似性归纳成若干类,同一类中的数据相似,不同类中的数据不相似。聚类划分的是未知的类,分类划分的是已知的类。将学生教育实习中的普通话、试讲成绩性质相近的归为一类,将英语、数理化成绩差别较大的归入不同的类,从而发现这些成绩与教育实习评定之间的相互关系。 最后,关联分析。关联分析是指如果两个或多个事物之间存在一定的关联,那么其中一个事物就能通过其他事物进行预测。它的目的是为了挖掘隐藏在数据间的相互关系。教育实习的评定就是通过关联分析,让我们了解教育实习的评定与普通话成绩和理论成绩以及试讲成绩密切相关。普通话成绩不好的成绩必定会影响试讲成绩,试讲成绩和理论成绩不好的成绩必定会影响教育实习的评定。这类发现的规律或知识可以帮助高校教育专业的老师制定出针对教育实习的教学管理方案,同时及时加以调整。
3 数据挖掘的主要技术方法
根据数据挖掘的方法,可分为以下几种[4]:
3.1 人工神经网络。神经网络是模拟神经系统执行的简单模型。由基本单元(神经元)组成,这些基本单元以简化的方式模仿自然界发现的生物神经元行为。
3.2 决策树。将已有的数据按照某个特定的目标变量,每一次分割会把不同种类的总体分割成小的、更为相似的群组。
3.3 关联规则。要求数据挖掘者要有准确的直觉,因为关联表述了现实的产品和服务是如何组合练习在一起的。
3.4 遗传算法。是模拟生物在自然环境中的遗传和进化过程而形成的一种自适应全局优化概率搜索算法。具有计算简单、优化效果好的特点,它在处理组合优化问题方面也有一定的优势,可用于聚类分析等。
3.5 联机分析处理(简称OLAP)。针对特定问题的联机数据访问和分析。通过对信息的观察形式进行快速、稳定一致和交互性的存取[5]。
3.6 K近邻算法。K最近邻(k-Nearest Neighbour,KNN),是最简单的机器学习算法之一。KNN算法中,所选择的邻居都是已经正确分类的对象。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别最近邻技术通过k个与之最相近的历史记录的组合来辨别新记录。KNN算法不仅可以用于分类,还可以用于回归[6]。
3.7 可视化。它采用直观的图形图表方式将挖掘出来的模式表现出来,支持多维数据的可视化,为数据分析人员提供很好的帮助。可视化技术这是一类辅助方法。
4 高校教育实习的概述
教育实习是高校师范教育专业中必不可少的实践环节,也是师范教育专业的必修课程,更是提高师范教育专业学生素质和技能的重要途径之一。高校教育实习的目的在于使师范专业的学生进一步巩固和运用所学的专业理论知识、教育理论知识和基本技能,在具体的教育和教学实践中得到锻炼,初步掌握备课规律、教学方法和教学工作的基本程序;使学生更深刻地认识到人民教师工作的光荣与历史使命,进一步树立忠诚党的教育事业的专业思想。同时,通过教育实习使学生走向社会接触本专业工作,拓宽知识面,锻炼学生综合运用所学的基础理论、基本技能和专业知识,提高实践动手能力,为师范专业的学生毕业后走上工作岗位打下一定的基础;同时可以检验教师的教学效果,为进一步提高教育教学质量,培养合格人才积累经验。因此,学生进行教育实习有着十分重要而深远的意义。
5 高校教育实习评定在数据挖掘中的分析
第一,认真的对待学生教育实习的教学与实践教学的设计。学生在校期间的学习课程大多都是相辅相成的,并且在课程与课程之间会有一定的关联性和前后顺序的关系。如果同学们之前所有的基础课程没有学好,那么后续的课程学习势必就会受到影响。除此之外,也存在一些情况。同一年级不同班级的学生学习同一门课程,也会因讲授课教师以及班级水平层次、同学自身文化水平、班级的学习氛围的不同,最后导致本次教育实习评定级别会相差非常大。结合往届参与教育实习学生的理论考试成绩、试讲成绩、普通话成绩、粉笔字成绩、板书成绩,运用数据挖掘的关联及序列分析等技术方法,就能从这些大量的数据中寻找出有价值的信息,通过分析得到许多有实效的规则和信息,利用这些规则和信息找出影响学生教育实习评定的最终因素,在此基础上不断调整和合理安排高校学生教育实习教学的相关课程。
第二,对教育专业学生及教师特征进行的数据挖掘。学校人事管理数据仓库和学生成绩系统里记录着教师及学生的学习及工作学习基本情况、社会活动、奖励处罚等的情况,使用数据挖掘的关联分析可以寻找教师的综合素质与学生成绩内在的联系。在实际情况中,教师的学历和教龄较高的时候,同专业同班级学生求学兴趣浓厚,班级学习氛围较好的情况下,就能关联分析出该专业该班级学生学习成绩良好以上的可能性。同时也可以根据学生的学习偏好以及班风、班干的带头作用等已知的信息来挖掘,帮助我们进行判断与事先制定好的行为目标来进行预期的比较,从如何提高学生的自主学习能力入手,帮助他们德、智、体、美全面和谐的发展。
第三,教师课堂教学质量的评估。教师课堂教学质量的好坏直接关系到学生课堂听课的质量,因此学生需要对教师课堂教学质量进行评估。高校会在每学期期中教学检查的时候,发一份教师课堂教学质量的评估表给抽样的学生来进行教师课堂教学质量进行评估。除了学生的评教之外,还需要有常规的教师自查评分(教学日历执行情况、出勤情况、课前准备情况、作业情况、课外辅导情况等)以及教研室主任听课评分(思想表现、教学态度、教学内容、教学方法、教学效果)。通过对教学质量评估数据库中的数据进行挖掘,挖掘教师教学态度、教学水平、教学方法、教学效果等四大主要项数据间有无必然的关联性。学生的评教评估表上的总分和最后评价等级可以反映出上同一课程教师课堂教学质量综合水平。通过评估表上学生对评估的该教师提出的不足,加上该教师的自查自评以及教研室主任听课评分能让决策者的我们更加合理快速的调整教学计划安排,改进授课教师的教学方式和方法,让学生能够保持良好的学习心态和积极性,提高整个班级的学习氛围。
第四,教师评学。学生评教是教师教学课堂质量的重要指标之一,那么教师评学是学生学习行为判定的唯一指标。要对教育专业的学生进行评学,首先确定授课教师的职称、学历,授课性质等指标。通过上课迟到评分、旷课情况评分、课堂纪律评分、课前预习和课后巩固评分、作业完成情况评分、课堂交流评分、班干部作用评分、与其他上课班级相比评分、与同课程的上届班级相比评分、班主任与您联系次数评价等这些重要的数据指标得分得到一些反馈信息。利用数据挖掘技术来对上述的数据指标进行分析,可以及时得到学生学习行为的评价结果,对于学生在校学习期间出现的不良的学习行为加以及时有效的纠正,让学生在校学习期间得到身心健康的发展。 6 数据挖掘在高校教育实习中面临的挑战
6.1 由于数据产生和收集技术的不断进步,数据挖掘算法要处理这些海量数据集,则算法必须是可伸缩的。可伸缩可能还需要实现新的数据结构,以有效的方式访问个别记录。
6.2 具有时间或空间分量的数据集也趋向于具有很高的维度。为低维数据开发的传统的数据分析技术通常不能很好地处理这样的高维数据。
6.3 传统的统计方法基于一种假设—检验模式。当前的数据分析任务常常需要产生和评估成千上万的假设,因此希望自动地产生和评估假设导致了一些数据挖掘技术的开发。面对庞大的数据, 现有的统计方法都遇到了问题,,于是人们对数据进行抽样。如何抽样,抽取多少样本,又怎样评价抽样的效果, 这些都是值得我们去探讨和研究[7]。
7 结束语
数据挖掘作为一个多学科交叉的新兴学科,在研究领域和商业领域得到了显著的成效。近几年,数据挖掘也被引入到高校的管理中,通过挖掘学生成绩等蕴含的信息,来分析判断与课程及授课教师之间的关系。利用这样的方法,可以更便捷的为高校的决策者在高校教育管理方面作出调控决策。
参考文献:
[1][美]Pang-Ning Tan Michael Steinbach Vipin Kumar.数据挖掘导论[M].2006,05.
[2](美)Michael J.A.Berry Gordon S.Linoff.数据挖掘技术:市场营销、销售与客户关系管理领域应用[M].2006,07.
[3]谢邦昌.数据挖掘Clementine应用实务[M].2008,04.
[4]李波.数据仓库与联机分析处理(OLAP)技术[J].北京广播学院学报:自然科学版,2005(12).
[5]基于度量学习的邻域k凸包集成方法[J].合肥工业大学学报:自然科学版,2013,2(05).
[6]赵岩.数据挖掘理论与技术[J].福建电脑,2006(02).
[7]张莉.数据挖掘技术及应用现状[J].中国石油大学胜利学院学报,2008(06).
作者简介:郭佳(1983-),本科学历,助教,研究领域:数据挖掘技术。
作者单位:桂林电子科技大学计算机科学与工程学院,广西桂林 541004