论文部分内容阅读
[摘 要]随着社会的不断发展,教育事业也得到了长足的进步,如何衡量一个学生的学业,需要利用学生的成绩。在高校中,学生成绩的计算比较复杂,各种学科以及不相同的学分比重给学生成绩的综合计算带来了很大困难。数字挖掘技术是一种良好的处理大量的、随机的、模糊的数据的一种有效的方法,所以数据挖掘技术被运用于学生成绩统计中,接下来重点分析数据挖掘技术在学生成绩分析中的应用研究。
[关键词]数字挖掘技术;学生成绩;分析应用;
中圖分类号:TP311.13 文献标识码:A 文章编号:1009-914X(2016)30-0090-01
数字挖掘技术是一种处理数据的方法技术,具体是从大量的、随机的、模糊的数据中提出隐藏其中又是有效信息的一个过程。在数据挖掘中,需要选择合适的分析工具和具体的统计方法,主要的方法包括事例推理、决策树、规则推理、模糊集、甚至神经网络、遗传算法等等,通过这些方法对数据进行有效的分析,同时还需要经过反复循环的过程,并且在过程中检查是否在每一步达到预期的目标,否则就要进行返回,重新进行调整,直到完成相应的目标。这一技术目前已经有了很大的发展,而且在进行有效的结合过程中,对社会有很大的促进作用。数据挖掘技术主要的流程包括信息收集、数据集成数据规约等等,但是具体分析来说,因为情况的复杂性,数据的挖掘需要经过信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示等八个步骤,这样才能够得到准确的结果。高校教学中,学生的成绩是最重要的一部分,但是高校学生成绩并不像初高中那样简单的试卷成绩,而是试卷成绩与平时成绩百分比的综合,而且在某些时候,看的并不是均分或者总分,而是学分绩点,所以高校学生成绩的计算需要运用数据挖掘处理技术。所以,数据挖掘技术在学生成绩分析中的应用研究就是本文需要讨论的重点。
一、数据挖掘技术简介
(一)数据挖掘技术的挖掘对象
数据挖掘技术作为一项重要的数据分析技术是在进行大数据处理分析的时候首先考虑的一种方法。数据挖掘技术也有一个范围广的挖掘对象,不仅包括关系数据库、对象数据库、数据仓库等各种数据库,还有文本数据源、多媒体数据库、空间数据库等复杂数据库,所以目前数据挖掘技术在各方面的数据处理中有很大的帮助作用,同时对于整个数据分析模块也是一个大的突破。
(二)数据挖掘技术的主要步骤
数据挖掘技术是一项复杂的数据分析处理的技术,在进行数据处理的过程中有几个重要的步骤,包括对信息的收集、数据的集成、数据的规约、数据的清理。在进行完这些基本的数据处理之后,还要进行数据的变化和挖掘,最后对整理分析完成的数据进行表示。下面简要介绍这些具体的步骤。
1.信息的收集
信息的收集是数据挖掘技术中首要的工作步骤,在这一步骤中,需要选择一个合适的数据库和数据存储,在将抽象的数据分析之后,把有效的特征和数据存入其中,进行接下来的具体分析。对于学生成绩的信息收集,就是把学生的总成绩、单科成绩以及各个学科中错误题的分数进行有效的录入,从而可以进行接下来的工作。
2.数据的集成
数据的集成也就是对数据的整理,把不同来源、格式和特点的数据进行集成,可以是物力集成,也可以是逻辑集成,从而把企业或者学校提供的数据进行全面的共享。在学生成绩统计的过程中,各个学科的成绩有学科教师进行录入,包括总成绩,每一道题目学生所得的分数等等,但是在此之前学校应该对每一种数据规定一定的格式,这样在数据集成的时候会有很大的方便。
3.数据的规约
在执行数据挖掘算法的时候需要用很长的时间,即使是少量的数据,所以商业运营的时候所使用的数据挖掘信息技术所需要的时间更长。数据规约技术虽然会很小,但是能够保持原始数据的完整性,并且在规约以后执行的数据挖掘的结果与之前执行的结果几乎保持一致。学生的成绩是不能有半点差错的,所以执行规约是一项重要的步骤。
4.数据的清理
数据的清理主要是对数据库中一些不完整的、有噪声的和不一致的数据进行清理,从而得到一些完整的、正确的、一致的数据信息,存入数据仓库中,否则,数据挖掘的结果会差强人意。在学生成绩的信息处理过程中,由于工作量很大,所以偶尔会对学生的有着成绩的录入漏掉,在规约的过程中,可以根据数据的综合将部分的数据进行补充完整。
5.数据的变换
数据的转换主要进行的就是将数据转换成为适合数据挖掘的形式,运用的主要方法是平滑聚集,数据概化,规范化。在学生统计的过程中,主要是对学生的各种成绩的形式进行转换,对于不同成绩展现方式需要转换成为不同的形式,数据的转换是方便学生、家长对成绩的分析和比较。
6.挖掘的过程
数据挖掘的过程是根据仓库中数据信息进行分析,主要应用的方法包括事例推理、决策树、模糊集、遗传算法等的方法。
7.模式评估
模式评估从商业角度来说,主要是由行业专家进行数据验证,但是在学校学生成绩的统计过程中,这一步不需要进行。
8.知识表示
知识表示所表示的就是将所得到的数据分析用可视化的方式呈现给用户,或者是用新的知识存在知识库中,提供给其他的程序使用。为了能够给用户呈现更加清楚明了的方式,在表示的时候应该用所熟知的方式表示。
二、数据挖掘技术在学生成绩分析中应用的具体方法
(一)遗传算法
遗传算法是一种随机搜索方法,主要是基于生物自然选择和遗传的机理,也是一种仿生全局的优化方法。在这种算法中,具有隐含并行性,所以非常容易和其他的模型进行结合。这些性质在数据挖掘中能够被加以应用。在学生数据统计的过程中,利用遗传算法对学生成绩的分析有简化的作用。
(二)决策树方法
决策树是一种常用于预测模型的算法,主要是将大量的数据进行分析,可以将其中有价值的信息进行分析。这种方法有很多的优点,包括描述的简单、分类的速度快、适合大规模数据的处理等等。在对学生的成绩进行分析整理的过程中,可以使用决策树的方法,因为学生的数量之多,学生所学习的科目之多,使得数据有了一个翻倍,所以用决策树可以将这些成绩进行简单快速的分析。
(三)粗集方法
粗集方法主要针对的研究对象是不精确、不确定知识的一种数学工具,其主要优点在于不需要额外的信息、算法简单容易操作。可以用粗集方法对类似与二维关系表的信息表进行处理,而且学生成绩就是以这种表现形式呈现的。
三、结束语
通过分析数据挖掘信息技术的执行步骤和具体的方法,进一步分析数据挖掘技术在学生成绩分析中的应用,从而促进教育事业的发展。
参考文献
[1] 数据挖掘技术在高校成人教育学生成绩分析中的应用研究;纪雅楠,魏振钢;中国海洋大学,2010年.
[2] 数据挖掘技术在学生成绩分析中的应用研究;康艳霞,朱敏;华东师范大学,2009年.
[3] 数据挖掘技术在学生成绩分析中的应用研究;李杰,刘天时;西安石油大学,2010年.
[关键词]数字挖掘技术;学生成绩;分析应用;
中圖分类号:TP311.13 文献标识码:A 文章编号:1009-914X(2016)30-0090-01
数字挖掘技术是一种处理数据的方法技术,具体是从大量的、随机的、模糊的数据中提出隐藏其中又是有效信息的一个过程。在数据挖掘中,需要选择合适的分析工具和具体的统计方法,主要的方法包括事例推理、决策树、规则推理、模糊集、甚至神经网络、遗传算法等等,通过这些方法对数据进行有效的分析,同时还需要经过反复循环的过程,并且在过程中检查是否在每一步达到预期的目标,否则就要进行返回,重新进行调整,直到完成相应的目标。这一技术目前已经有了很大的发展,而且在进行有效的结合过程中,对社会有很大的促进作用。数据挖掘技术主要的流程包括信息收集、数据集成数据规约等等,但是具体分析来说,因为情况的复杂性,数据的挖掘需要经过信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示等八个步骤,这样才能够得到准确的结果。高校教学中,学生的成绩是最重要的一部分,但是高校学生成绩并不像初高中那样简单的试卷成绩,而是试卷成绩与平时成绩百分比的综合,而且在某些时候,看的并不是均分或者总分,而是学分绩点,所以高校学生成绩的计算需要运用数据挖掘处理技术。所以,数据挖掘技术在学生成绩分析中的应用研究就是本文需要讨论的重点。
一、数据挖掘技术简介
(一)数据挖掘技术的挖掘对象
数据挖掘技术作为一项重要的数据分析技术是在进行大数据处理分析的时候首先考虑的一种方法。数据挖掘技术也有一个范围广的挖掘对象,不仅包括关系数据库、对象数据库、数据仓库等各种数据库,还有文本数据源、多媒体数据库、空间数据库等复杂数据库,所以目前数据挖掘技术在各方面的数据处理中有很大的帮助作用,同时对于整个数据分析模块也是一个大的突破。
(二)数据挖掘技术的主要步骤
数据挖掘技术是一项复杂的数据分析处理的技术,在进行数据处理的过程中有几个重要的步骤,包括对信息的收集、数据的集成、数据的规约、数据的清理。在进行完这些基本的数据处理之后,还要进行数据的变化和挖掘,最后对整理分析完成的数据进行表示。下面简要介绍这些具体的步骤。
1.信息的收集
信息的收集是数据挖掘技术中首要的工作步骤,在这一步骤中,需要选择一个合适的数据库和数据存储,在将抽象的数据分析之后,把有效的特征和数据存入其中,进行接下来的具体分析。对于学生成绩的信息收集,就是把学生的总成绩、单科成绩以及各个学科中错误题的分数进行有效的录入,从而可以进行接下来的工作。
2.数据的集成
数据的集成也就是对数据的整理,把不同来源、格式和特点的数据进行集成,可以是物力集成,也可以是逻辑集成,从而把企业或者学校提供的数据进行全面的共享。在学生成绩统计的过程中,各个学科的成绩有学科教师进行录入,包括总成绩,每一道题目学生所得的分数等等,但是在此之前学校应该对每一种数据规定一定的格式,这样在数据集成的时候会有很大的方便。
3.数据的规约
在执行数据挖掘算法的时候需要用很长的时间,即使是少量的数据,所以商业运营的时候所使用的数据挖掘信息技术所需要的时间更长。数据规约技术虽然会很小,但是能够保持原始数据的完整性,并且在规约以后执行的数据挖掘的结果与之前执行的结果几乎保持一致。学生的成绩是不能有半点差错的,所以执行规约是一项重要的步骤。
4.数据的清理
数据的清理主要是对数据库中一些不完整的、有噪声的和不一致的数据进行清理,从而得到一些完整的、正确的、一致的数据信息,存入数据仓库中,否则,数据挖掘的结果会差强人意。在学生成绩的信息处理过程中,由于工作量很大,所以偶尔会对学生的有着成绩的录入漏掉,在规约的过程中,可以根据数据的综合将部分的数据进行补充完整。
5.数据的变换
数据的转换主要进行的就是将数据转换成为适合数据挖掘的形式,运用的主要方法是平滑聚集,数据概化,规范化。在学生统计的过程中,主要是对学生的各种成绩的形式进行转换,对于不同成绩展现方式需要转换成为不同的形式,数据的转换是方便学生、家长对成绩的分析和比较。
6.挖掘的过程
数据挖掘的过程是根据仓库中数据信息进行分析,主要应用的方法包括事例推理、决策树、模糊集、遗传算法等的方法。
7.模式评估
模式评估从商业角度来说,主要是由行业专家进行数据验证,但是在学校学生成绩的统计过程中,这一步不需要进行。
8.知识表示
知识表示所表示的就是将所得到的数据分析用可视化的方式呈现给用户,或者是用新的知识存在知识库中,提供给其他的程序使用。为了能够给用户呈现更加清楚明了的方式,在表示的时候应该用所熟知的方式表示。
二、数据挖掘技术在学生成绩分析中应用的具体方法
(一)遗传算法
遗传算法是一种随机搜索方法,主要是基于生物自然选择和遗传的机理,也是一种仿生全局的优化方法。在这种算法中,具有隐含并行性,所以非常容易和其他的模型进行结合。这些性质在数据挖掘中能够被加以应用。在学生数据统计的过程中,利用遗传算法对学生成绩的分析有简化的作用。
(二)决策树方法
决策树是一种常用于预测模型的算法,主要是将大量的数据进行分析,可以将其中有价值的信息进行分析。这种方法有很多的优点,包括描述的简单、分类的速度快、适合大规模数据的处理等等。在对学生的成绩进行分析整理的过程中,可以使用决策树的方法,因为学生的数量之多,学生所学习的科目之多,使得数据有了一个翻倍,所以用决策树可以将这些成绩进行简单快速的分析。
(三)粗集方法
粗集方法主要针对的研究对象是不精确、不确定知识的一种数学工具,其主要优点在于不需要额外的信息、算法简单容易操作。可以用粗集方法对类似与二维关系表的信息表进行处理,而且学生成绩就是以这种表现形式呈现的。
三、结束语
通过分析数据挖掘信息技术的执行步骤和具体的方法,进一步分析数据挖掘技术在学生成绩分析中的应用,从而促进教育事业的发展。
参考文献
[1] 数据挖掘技术在高校成人教育学生成绩分析中的应用研究;纪雅楠,魏振钢;中国海洋大学,2010年.
[2] 数据挖掘技术在学生成绩分析中的应用研究;康艳霞,朱敏;华东师范大学,2009年.
[3] 数据挖掘技术在学生成绩分析中的应用研究;李杰,刘天时;西安石油大学,2010年.