论文部分内容阅读
[摘要]数据挖掘是人们认识数据、理解数据的一种新的智能手段。本文将数据挖掘方法和技术与教学中相关环节相结合,能够从中提取出隐藏在数据之中的有用信息,指导教学工作,改善教学效果,本文就大学英语教学情境下,如何将数据挖掘方法和技术运用于英语测试成绩分析,分别提出了构想并进行了相关探讨。
[关键词] 数据挖掘大学英语分层次教学成绩分析关联规则
一、前言
随着大学英语教学改革的深入发展,分层次教学已经是各高校开展英语教学的普遍方式。分层次进行教学,打破了原来的局限于学生专业进行授课的班级模式, 基本实现了按照学生实际英语水平开展教学,更加贴近了学生实际,对不同英语水平的学生更具有针对性,能够更好的做到因材施教,促进学生学习积极性,提高学生英语能力。在教学环节中,最为直观的反映教师教学效果和学生学习收获的一个重要指标则是测试成绩。实际上,学生测试成绩包含着更为复杂,更为丰富,甚至是学生个性化的信息。一味的将测试成绩的高低归结于教师个体教学因素的影响或者学生学习主观能动性发挥程度的做法,都缺乏科学性和严谨性。影响学生考试成绩的因素很多,其中有的甚至是在教学中教师单凭教学经验无法察觉的或者完全脱离于教学以外的其他因素。因此,认真对待并且分析学生测试成绩,能够准确把握学生学习动态,了解学生学习需要,掌握学生学习效果。目前,尽管教师在学期测试结束后要对学生测试成绩进行分析,但基本上都是采用简单的数据统计方法,计算平均成绩,及格率及各个分数段的情况等,得到的信息仅仅是数字上的分析,比较笼统,对影响成绩的各个因素的分析深度不够,不能够准确了解和掌握形成这一成绩的具体原因,对今后的教学指导性也并不是很明显。
随着信息技术的不断发展,数据挖掘技术已经被广泛地应用于社会管理,生产,流通,金融,医疗,教育等多个领域,并发挥了极其重要的作用。数据挖掘是一门能够从大量数据中发现有用知识的技术学科,是从大型数据库或数据仓库中提取隐含的,未知的,非平凡的极有潜在应用价值的信息或模式。利用这一技术,我们可以通过客观统计和分析, 从大量数据中发现潜在规律,找出隐含的模式,准确掌握未来的动态。突破原来的简单利用统计方法进行成绩分析的束缚,将数据挖掘技术与大学英语分层次教学中产生的学生期末测试成绩数据相结合,利用数据挖掘相关分析方法,从中提取出隐藏在数据之中的有用信息,使信息系统的功能得到最大程度的发挥和利用,找出学生测试成绩和教学各个环节及因素之间内在的联系,发现非教学因素对学生成绩的影响,形成新的知识,并使之能满足大学英语分层次教学要求,提高学生学习成绩,提高学生英语应用能力,促进教学质量的提高。
二、英语教学成绩的数据挖掘方法及工具概述
数据挖掘就是从大量的、不完全的、有噪声的、模糊的数据中,提取隐含在其中的以前未知的并具有潜在可用的模式的过程。数据挖掘要解决的首要和最重要任务,就是如何对复杂的、不完整的数据进行分析,发现数据间的关系,如何提取有用的模式,简化信息处理,如何确定不精确、不完备的知识表达。数据清理、数据收集、数据选择、数据变换、数据挖掘、模式评估、知识表示等则被包括在数据挖掘过程中;而以上各过程并不是一次就能实现,其中某些步骤或者全过程可能要反复进行。数据挖掘的方法和工具有:决策树,神经网络,关联规则,数据可视化,粗糙集,分析方法等。
决策树是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用建好的决策树对数据进行预测。决策树是通过一系列规则对数据进行分类的过程,它实现了数据的可视化,其输出结果容易理解,精确度较好,效率较高。
关联规则就是形如XY的逻辑蕴含关系,由一连串的“如果,则”的逻辑规则对资料进行细分的技术。关联规则一般应用在事物数据库中,其中每个事物都由一个记录集合组成。这种事物数据库通常都包括极为庞大的数据。因此当前的关联规则发现技巧正努力根据基于一定考虑的支持度来削减搜索空间。其中支持度是一种基于用户事物在事物日志中出现的数目的度量。信任度是指蕴含的强度。关联规则就是支持度和信任度分别满足用户给定阈值的规则。 发现关联规则的过程分为两个步骤:第一步通过迭代,检索出事务数据库中的所有频繁项集,即支持度不低于用户设定的阈值的项集;第二步利用频繁项集构造出满足用户最小信任度的规则。其中,挖掘或识别出所有频繁项集是该算法的核心,占整个计算量的大部分。
三、运用数据挖掘方法和技术分析大学英语教学测试成绩
传统的利用简单的统计学知识来分析测试成绩,能够让教师通过相关数据得到学生的部分情况,但是对形成这样的成绩的各因素及其影响的力度都无法准确把握;对今后的教学有一定的指导意义,但是指导作用却并不明显。将数据挖掘技术和现代教育统计学中有关技术相结合,对大学英语分层次教学学生的测试成绩进行分析,通过对教学活动中的各影响因素进行数据挖掘,从而发现影响教学结果的关联规则,并将数据挖掘的预测结果反馈到新的教学活动中,能够为实际教学活动提供更为明确的决策指导。在大学英语分层次教学测试成绩方面,数据挖掘方法和技术可运用于以下几个方面:
(一)分析测试成绩和确定授课班级。目前在分层次教学中,大多都是在新生入学时就按照学生成绩高低分班教学,此后所在班级就一直保持不变。教学实践中发现,在经过了每个学期的教学实践之后,所在班级的学生在英语应用能力和水平上都呈现出高低不同的变化;继续保持原来班级授课,出现了新的问题:有的学生在知识的汲取中“不够吃”,而有的则又无法吸收并消化新的内容,学习显得吃力;这就使得教师对于教学内容的选定和教学进度的设置都相当困难,且在一定程度上又背离了分层次教学的初衷,难以取得良好的教学效果。
此外,仅仅笼统的依据学生入学成绩来分层次进行教学,只是考虑了学生已经具备的英语知识与技能的基础,而无法知晓影响学生学习的其他因素:如学习动机、个人对学习的期望、个人生活经验等。这些隐藏的因素通过简单的数字分析并不能得到,但是却实实在在的影响着学生的学习过程,影响着测试成绩。
采用数据挖掘技术对学期测试成绩数据及其相关各种因素进行分析,能够综合考虑到各种因素对学生学习的影响及影响的程度,提取有指导教师教学价值的信息:不仅仅是依照成绩的高低来重新划分班级,更能全面考虑学生诸如兴趣,爱好,专业,生源地等各项因素,根据每个学期学习后学生的具体情况,适当调整班级,充分实现大学英语分层次教学因材施教的初衷,达到良好教学效果的目的。
(二)分析测试成绩以加强师资队伍建设。教师是教学环节中重要的因素,是知识的引领者和传输者,对学生有着重要的影响。一支专业知识过硬,教学业务能力强,能与学生有效沟通的有活力的教师队伍,能够充分调动学生学习积极性,取得好的成绩。在大学英语分层次教学模式下,虽然测试成绩并不能完全体现学生所获得的语言应用能力,但是也基本能够反映该种教学模式是否成功,也能够在一定程度上反映出教师所取得的教学效果,对教师的自身提高和教学工作都有重要意义。
教师的年龄,职称对学生的成绩都有着影响,为掌握它们之间的关系,可以将数据挖掘技术运用于考试成绩分析中,用决策树来分析教师职称,年龄结构对学生考试成绩影响:
随机抽取本校公共外语教学部门教师信息,将教师的年龄、职称、所教授学生的成绩(成绩对应分值按照优,良,中,差来划分)等数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策树对新数据进行分析,可以得出教师年龄,职称结构与学生学习成绩间的联系,从而调整教师结构,加强师资队伍建设,建设一支与教学相适应的,高素质,高能力,责任心强的教师队伍。
(三)分析学生学习行为等各种因素对成绩的影响。关联规则是数据挖掘研究的一个重要的、高度活跃的领域。关联分析挖掘数据中项集之间有意义的关联或相关联系。关联分析能够识别出相互关联的事件,预测一个事件发生时有多大的概率发生另一个事件。在商业领域,从大量商业数据中发现有意义的关联关系,可以帮助商业决策的制定,提高企业竞争力。而在教学中,运用关联规则,也能找出数据库中数值的相关性,能有效地指导教学。
通过学生管理系统获得诸如学号,姓名,性别,籍贯,所属院系,专业,班级等学生基本信息;通过网络在线平台对学生学号,学习兴趣,学习之前对知识掌握情况,课堂学习效果,课后网络自主学习情况,小组合作学习等信息进行调查统计;教师可以采集学生的测试成绩数据。将数据采集得到的上述多个数据库文件,利用数据库技术生成学生成绩分析基本数据库。对学生成绩分析基本数据库进行数据清理,数据转换,数据消减,形成新的学生成绩分析基本数据表;再进行数据分类挖掘,生成分类规则,找出学生成绩与学生各个学习行为之间的内在联系。利用得到的联系,教师可以充分鼓励和强化某些学习行为,如小组合作模式学习(在分组时,不是随机或者按学生意愿自由组合,而是依据得到的联系,对小组成员进行科学的组合;小组成员由性别,学习成绩,个性特征,家庭,社会背景等方面有异质性的学生组成,既体现小组内部的合理差异,又能在全班各小组之间形成大体均衡),小组成员相互促进,真正发挥该学习模式的作用,提升教学效果。
四、结束语
将数据挖掘技术应用到教学实践环节中,可以为实际教学活动提供决策指导。在分层次教学模式和网络自主学习平台综合作用的大学英语教学体系下,教师所应对的学生信息量更多更丰富,仅仅只凭借教师的教学经验来推测学生的学习情况,并不能取得好的效果。数据挖掘作为一种工具,它本身就是人们大量实践的结晶,能够很好的辅助教师获取有用的信息,能够为建立传统教学中很难获取或不可能获取的模型提供捷径,为教师的教学决策提供科学的依据。
因此,将数据挖掘方法应用到对大学英语教学产生的学生测试成绩进行分析,对教学活动中的各影响因素进行数据挖掘,从而发现影响教学结果的关联规则,并将数据挖掘的结果反馈到新的教学活动中,为实际教学活动提供决策指导,帮助教师根据学生实际情况确定教学思路,真正做到因材施教,改善教学效果,提高英语教学质量。
参考文献
[1]数据挖掘在高校教育领域中应用的浅谈
[2]胡玉荣 基于粗糙集理论的数据挖掘技术在高校学生成绩分析中的作用
[3]王长娥 数据挖掘技术在教育中的应用
[4] 李新良.数据挖掘在教学测评系统中的应用与研究[J]
[5]张震 数据挖掘技术分析及其在高校管理决策中的应用
[关键词] 数据挖掘大学英语分层次教学成绩分析关联规则
一、前言
随着大学英语教学改革的深入发展,分层次教学已经是各高校开展英语教学的普遍方式。分层次进行教学,打破了原来的局限于学生专业进行授课的班级模式, 基本实现了按照学生实际英语水平开展教学,更加贴近了学生实际,对不同英语水平的学生更具有针对性,能够更好的做到因材施教,促进学生学习积极性,提高学生英语能力。在教学环节中,最为直观的反映教师教学效果和学生学习收获的一个重要指标则是测试成绩。实际上,学生测试成绩包含着更为复杂,更为丰富,甚至是学生个性化的信息。一味的将测试成绩的高低归结于教师个体教学因素的影响或者学生学习主观能动性发挥程度的做法,都缺乏科学性和严谨性。影响学生考试成绩的因素很多,其中有的甚至是在教学中教师单凭教学经验无法察觉的或者完全脱离于教学以外的其他因素。因此,认真对待并且分析学生测试成绩,能够准确把握学生学习动态,了解学生学习需要,掌握学生学习效果。目前,尽管教师在学期测试结束后要对学生测试成绩进行分析,但基本上都是采用简单的数据统计方法,计算平均成绩,及格率及各个分数段的情况等,得到的信息仅仅是数字上的分析,比较笼统,对影响成绩的各个因素的分析深度不够,不能够准确了解和掌握形成这一成绩的具体原因,对今后的教学指导性也并不是很明显。
随着信息技术的不断发展,数据挖掘技术已经被广泛地应用于社会管理,生产,流通,金融,医疗,教育等多个领域,并发挥了极其重要的作用。数据挖掘是一门能够从大量数据中发现有用知识的技术学科,是从大型数据库或数据仓库中提取隐含的,未知的,非平凡的极有潜在应用价值的信息或模式。利用这一技术,我们可以通过客观统计和分析, 从大量数据中发现潜在规律,找出隐含的模式,准确掌握未来的动态。突破原来的简单利用统计方法进行成绩分析的束缚,将数据挖掘技术与大学英语分层次教学中产生的学生期末测试成绩数据相结合,利用数据挖掘相关分析方法,从中提取出隐藏在数据之中的有用信息,使信息系统的功能得到最大程度的发挥和利用,找出学生测试成绩和教学各个环节及因素之间内在的联系,发现非教学因素对学生成绩的影响,形成新的知识,并使之能满足大学英语分层次教学要求,提高学生学习成绩,提高学生英语应用能力,促进教学质量的提高。
二、英语教学成绩的数据挖掘方法及工具概述
数据挖掘就是从大量的、不完全的、有噪声的、模糊的数据中,提取隐含在其中的以前未知的并具有潜在可用的模式的过程。数据挖掘要解决的首要和最重要任务,就是如何对复杂的、不完整的数据进行分析,发现数据间的关系,如何提取有用的模式,简化信息处理,如何确定不精确、不完备的知识表达。数据清理、数据收集、数据选择、数据变换、数据挖掘、模式评估、知识表示等则被包括在数据挖掘过程中;而以上各过程并不是一次就能实现,其中某些步骤或者全过程可能要反复进行。数据挖掘的方法和工具有:决策树,神经网络,关联规则,数据可视化,粗糙集,分析方法等。
决策树是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用建好的决策树对数据进行预测。决策树是通过一系列规则对数据进行分类的过程,它实现了数据的可视化,其输出结果容易理解,精确度较好,效率较高。
关联规则就是形如XY的逻辑蕴含关系,由一连串的“如果,则”的逻辑规则对资料进行细分的技术。关联规则一般应用在事物数据库中,其中每个事物都由一个记录集合组成。这种事物数据库通常都包括极为庞大的数据。因此当前的关联规则发现技巧正努力根据基于一定考虑的支持度来削减搜索空间。其中支持度是一种基于用户事物在事物日志中出现的数目的度量。信任度是指蕴含的强度。关联规则就是支持度和信任度分别满足用户给定阈值的规则。 发现关联规则的过程分为两个步骤:第一步通过迭代,检索出事务数据库中的所有频繁项集,即支持度不低于用户设定的阈值的项集;第二步利用频繁项集构造出满足用户最小信任度的规则。其中,挖掘或识别出所有频繁项集是该算法的核心,占整个计算量的大部分。
三、运用数据挖掘方法和技术分析大学英语教学测试成绩
传统的利用简单的统计学知识来分析测试成绩,能够让教师通过相关数据得到学生的部分情况,但是对形成这样的成绩的各因素及其影响的力度都无法准确把握;对今后的教学有一定的指导意义,但是指导作用却并不明显。将数据挖掘技术和现代教育统计学中有关技术相结合,对大学英语分层次教学学生的测试成绩进行分析,通过对教学活动中的各影响因素进行数据挖掘,从而发现影响教学结果的关联规则,并将数据挖掘的预测结果反馈到新的教学活动中,能够为实际教学活动提供更为明确的决策指导。在大学英语分层次教学测试成绩方面,数据挖掘方法和技术可运用于以下几个方面:
(一)分析测试成绩和确定授课班级。目前在分层次教学中,大多都是在新生入学时就按照学生成绩高低分班教学,此后所在班级就一直保持不变。教学实践中发现,在经过了每个学期的教学实践之后,所在班级的学生在英语应用能力和水平上都呈现出高低不同的变化;继续保持原来班级授课,出现了新的问题:有的学生在知识的汲取中“不够吃”,而有的则又无法吸收并消化新的内容,学习显得吃力;这就使得教师对于教学内容的选定和教学进度的设置都相当困难,且在一定程度上又背离了分层次教学的初衷,难以取得良好的教学效果。
此外,仅仅笼统的依据学生入学成绩来分层次进行教学,只是考虑了学生已经具备的英语知识与技能的基础,而无法知晓影响学生学习的其他因素:如学习动机、个人对学习的期望、个人生活经验等。这些隐藏的因素通过简单的数字分析并不能得到,但是却实实在在的影响着学生的学习过程,影响着测试成绩。
采用数据挖掘技术对学期测试成绩数据及其相关各种因素进行分析,能够综合考虑到各种因素对学生学习的影响及影响的程度,提取有指导教师教学价值的信息:不仅仅是依照成绩的高低来重新划分班级,更能全面考虑学生诸如兴趣,爱好,专业,生源地等各项因素,根据每个学期学习后学生的具体情况,适当调整班级,充分实现大学英语分层次教学因材施教的初衷,达到良好教学效果的目的。
(二)分析测试成绩以加强师资队伍建设。教师是教学环节中重要的因素,是知识的引领者和传输者,对学生有着重要的影响。一支专业知识过硬,教学业务能力强,能与学生有效沟通的有活力的教师队伍,能够充分调动学生学习积极性,取得好的成绩。在大学英语分层次教学模式下,虽然测试成绩并不能完全体现学生所获得的语言应用能力,但是也基本能够反映该种教学模式是否成功,也能够在一定程度上反映出教师所取得的教学效果,对教师的自身提高和教学工作都有重要意义。
教师的年龄,职称对学生的成绩都有着影响,为掌握它们之间的关系,可以将数据挖掘技术运用于考试成绩分析中,用决策树来分析教师职称,年龄结构对学生考试成绩影响:
随机抽取本校公共外语教学部门教师信息,将教师的年龄、职称、所教授学生的成绩(成绩对应分值按照优,良,中,差来划分)等数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策树对新数据进行分析,可以得出教师年龄,职称结构与学生学习成绩间的联系,从而调整教师结构,加强师资队伍建设,建设一支与教学相适应的,高素质,高能力,责任心强的教师队伍。
(三)分析学生学习行为等各种因素对成绩的影响。关联规则是数据挖掘研究的一个重要的、高度活跃的领域。关联分析挖掘数据中项集之间有意义的关联或相关联系。关联分析能够识别出相互关联的事件,预测一个事件发生时有多大的概率发生另一个事件。在商业领域,从大量商业数据中发现有意义的关联关系,可以帮助商业决策的制定,提高企业竞争力。而在教学中,运用关联规则,也能找出数据库中数值的相关性,能有效地指导教学。
通过学生管理系统获得诸如学号,姓名,性别,籍贯,所属院系,专业,班级等学生基本信息;通过网络在线平台对学生学号,学习兴趣,学习之前对知识掌握情况,课堂学习效果,课后网络自主学习情况,小组合作学习等信息进行调查统计;教师可以采集学生的测试成绩数据。将数据采集得到的上述多个数据库文件,利用数据库技术生成学生成绩分析基本数据库。对学生成绩分析基本数据库进行数据清理,数据转换,数据消减,形成新的学生成绩分析基本数据表;再进行数据分类挖掘,生成分类规则,找出学生成绩与学生各个学习行为之间的内在联系。利用得到的联系,教师可以充分鼓励和强化某些学习行为,如小组合作模式学习(在分组时,不是随机或者按学生意愿自由组合,而是依据得到的联系,对小组成员进行科学的组合;小组成员由性别,学习成绩,个性特征,家庭,社会背景等方面有异质性的学生组成,既体现小组内部的合理差异,又能在全班各小组之间形成大体均衡),小组成员相互促进,真正发挥该学习模式的作用,提升教学效果。
四、结束语
将数据挖掘技术应用到教学实践环节中,可以为实际教学活动提供决策指导。在分层次教学模式和网络自主学习平台综合作用的大学英语教学体系下,教师所应对的学生信息量更多更丰富,仅仅只凭借教师的教学经验来推测学生的学习情况,并不能取得好的效果。数据挖掘作为一种工具,它本身就是人们大量实践的结晶,能够很好的辅助教师获取有用的信息,能够为建立传统教学中很难获取或不可能获取的模型提供捷径,为教师的教学决策提供科学的依据。
因此,将数据挖掘方法应用到对大学英语教学产生的学生测试成绩进行分析,对教学活动中的各影响因素进行数据挖掘,从而发现影响教学结果的关联规则,并将数据挖掘的结果反馈到新的教学活动中,为实际教学活动提供决策指导,帮助教师根据学生实际情况确定教学思路,真正做到因材施教,改善教学效果,提高英语教学质量。
参考文献
[1]数据挖掘在高校教育领域中应用的浅谈
[2]胡玉荣 基于粗糙集理论的数据挖掘技术在高校学生成绩分析中的作用
[3]王长娥 数据挖掘技术在教育中的应用
[4] 李新良.数据挖掘在教学测评系统中的应用与研究[J]
[5]张震 数据挖掘技术分析及其在高校管理决策中的应用