数据挖掘技术在学生成绩分析中的应用研究

来源 :中国科技博览 | 被引量 : 0次 | 上传用户:libowen1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要]随着社会的不断发展,教育事业也得到了长足的进步,如何衡量一个学生的学业,需要利用学生的成绩。在高校中,学生成绩的计算比较复杂,各种学科以及不相同的学分比重给学生成绩的综合计算带来了很大困难。数字挖掘技术是一种良好的处理大量的、随机的、模糊的数据的一种有效的方法,所以数据挖掘技术被运用于学生成绩统计中,接下来重点分析数据挖掘技术在学生成绩分析中的应用研究。
  [关键词]数字挖掘技术;学生成绩;分析应用;
  中圖分类号:TP311.13 文献标识码:A 文章编号:1009-914X(2016)30-0090-01
  数字挖掘技术是一种处理数据的方法技术,具体是从大量的、随机的、模糊的数据中提出隐藏其中又是有效信息的一个过程。在数据挖掘中,需要选择合适的分析工具和具体的统计方法,主要的方法包括事例推理、决策树、规则推理、模糊集、甚至神经网络、遗传算法等等,通过这些方法对数据进行有效的分析,同时还需要经过反复循环的过程,并且在过程中检查是否在每一步达到预期的目标,否则就要进行返回,重新进行调整,直到完成相应的目标。这一技术目前已经有了很大的发展,而且在进行有效的结合过程中,对社会有很大的促进作用。数据挖掘技术主要的流程包括信息收集、数据集成数据规约等等,但是具体分析来说,因为情况的复杂性,数据的挖掘需要经过信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示等八个步骤,这样才能够得到准确的结果。高校教学中,学生的成绩是最重要的一部分,但是高校学生成绩并不像初高中那样简单的试卷成绩,而是试卷成绩与平时成绩百分比的综合,而且在某些时候,看的并不是均分或者总分,而是学分绩点,所以高校学生成绩的计算需要运用数据挖掘处理技术。所以,数据挖掘技术在学生成绩分析中的应用研究就是本文需要讨论的重点。
  一、数据挖掘技术简介
  (一)数据挖掘技术的挖掘对象
  数据挖掘技术作为一项重要的数据分析技术是在进行大数据处理分析的时候首先考虑的一种方法。数据挖掘技术也有一个范围广的挖掘对象,不仅包括关系数据库、对象数据库、数据仓库等各种数据库,还有文本数据源、多媒体数据库、空间数据库等复杂数据库,所以目前数据挖掘技术在各方面的数据处理中有很大的帮助作用,同时对于整个数据分析模块也是一个大的突破。
  (二)数据挖掘技术的主要步骤
  数据挖掘技术是一项复杂的数据分析处理的技术,在进行数据处理的过程中有几个重要的步骤,包括对信息的收集、数据的集成、数据的规约、数据的清理。在进行完这些基本的数据处理之后,还要进行数据的变化和挖掘,最后对整理分析完成的数据进行表示。下面简要介绍这些具体的步骤。
  1.信息的收集
  信息的收集是数据挖掘技术中首要的工作步骤,在这一步骤中,需要选择一个合适的数据库和数据存储,在将抽象的数据分析之后,把有效的特征和数据存入其中,进行接下来的具体分析。对于学生成绩的信息收集,就是把学生的总成绩、单科成绩以及各个学科中错误题的分数进行有效的录入,从而可以进行接下来的工作。
  2.数据的集成
  数据的集成也就是对数据的整理,把不同来源、格式和特点的数据进行集成,可以是物力集成,也可以是逻辑集成,从而把企业或者学校提供的数据进行全面的共享。在学生成绩统计的过程中,各个学科的成绩有学科教师进行录入,包括总成绩,每一道题目学生所得的分数等等,但是在此之前学校应该对每一种数据规定一定的格式,这样在数据集成的时候会有很大的方便。
  3.数据的规约
  在执行数据挖掘算法的时候需要用很长的时间,即使是少量的数据,所以商业运营的时候所使用的数据挖掘信息技术所需要的时间更长。数据规约技术虽然会很小,但是能够保持原始数据的完整性,并且在规约以后执行的数据挖掘的结果与之前执行的结果几乎保持一致。学生的成绩是不能有半点差错的,所以执行规约是一项重要的步骤。
  4.数据的清理
  数据的清理主要是对数据库中一些不完整的、有噪声的和不一致的数据进行清理,从而得到一些完整的、正确的、一致的数据信息,存入数据仓库中,否则,数据挖掘的结果会差强人意。在学生成绩的信息处理过程中,由于工作量很大,所以偶尔会对学生的有着成绩的录入漏掉,在规约的过程中,可以根据数据的综合将部分的数据进行补充完整。
  5.数据的变换
  数据的转换主要进行的就是将数据转换成为适合数据挖掘的形式,运用的主要方法是平滑聚集,数据概化,规范化。在学生统计的过程中,主要是对学生的各种成绩的形式进行转换,对于不同成绩展现方式需要转换成为不同的形式,数据的转换是方便学生、家长对成绩的分析和比较。
  6.挖掘的过程
  数据挖掘的过程是根据仓库中数据信息进行分析,主要应用的方法包括事例推理、决策树、模糊集、遗传算法等的方法。
  7.模式评估
  模式评估从商业角度来说,主要是由行业专家进行数据验证,但是在学校学生成绩的统计过程中,这一步不需要进行。
  8.知识表示
  知识表示所表示的就是将所得到的数据分析用可视化的方式呈现给用户,或者是用新的知识存在知识库中,提供给其他的程序使用。为了能够给用户呈现更加清楚明了的方式,在表示的时候应该用所熟知的方式表示。
  二、数据挖掘技术在学生成绩分析中应用的具体方法
  (一)遗传算法
  遗传算法是一种随机搜索方法,主要是基于生物自然选择和遗传的机理,也是一种仿生全局的优化方法。在这种算法中,具有隐含并行性,所以非常容易和其他的模型进行结合。这些性质在数据挖掘中能够被加以应用。在学生数据统计的过程中,利用遗传算法对学生成绩的分析有简化的作用。
  (二)决策树方法
  决策树是一种常用于预测模型的算法,主要是将大量的数据进行分析,可以将其中有价值的信息进行分析。这种方法有很多的优点,包括描述的简单、分类的速度快、适合大规模数据的处理等等。在对学生的成绩进行分析整理的过程中,可以使用决策树的方法,因为学生的数量之多,学生所学习的科目之多,使得数据有了一个翻倍,所以用决策树可以将这些成绩进行简单快速的分析。
  (三)粗集方法
  粗集方法主要针对的研究对象是不精确、不确定知识的一种数学工具,其主要优点在于不需要额外的信息、算法简单容易操作。可以用粗集方法对类似与二维关系表的信息表进行处理,而且学生成绩就是以这种表现形式呈现的。
  三、结束语
  通过分析数据挖掘信息技术的执行步骤和具体的方法,进一步分析数据挖掘技术在学生成绩分析中的应用,从而促进教育事业的发展。
  参考文献
  [1] 数据挖掘技术在高校成人教育学生成绩分析中的应用研究;纪雅楠,魏振钢;中国海洋大学,2010年.
  [2] 数据挖掘技术在学生成绩分析中的应用研究;康艳霞,朱敏;华东师范大学,2009年.
  [3] 数据挖掘技术在学生成绩分析中的应用研究;李杰,刘天时;西安石油大学,2010年.
其他文献
[摘 要]介绍了GCY470型内燃调车机车车体结构、主要部件结构及特点,对机车车体主要结构进行了轻量化设计,并对其进行了简要的有限元分析和总结。  [关键词]内燃机车 地铁调车 车体 结构 轻量化 强度  中图分类号:TM641 文献标识码:A 文章编号:1009-914X(2016)30-0044-02  前言  轻量化设计已经成为车体设计的重要目标,随着机车功率的加大和运用速度的提高,对机车车
期刊
[摘 要]泵站工程是水利工程中的一个重要环节,泵站的建设和安全高效运行直接关系到我国经济社会的健康稳定发展。为此本文就水利工程中泵站建设和运行管理提出存在问题及应对措施。  [关键词]水利工程 泵站建设 运行管理 措施  中图分类号:S114 文献标识码:A 文章编号:1009-914X(2016)30-0056-01  前言  近年来,水利工程在泵站建设的数量上不断加大,从而推动了我国经济社会的
期刊
[摘 要]基于对西门子S7-300的研究基础之上,设计出了一种基于这一设备的城市污水处理自动化控制系统。系统的构成主要就包括中控室上机位系统、仪表系统、网络系统以及现场分控站等。经过实践验证表明,系统控制效果较好,维护处理简单。  [关键词]西门子S7-300;城市污水处理;自动控制系统;网络拓扑结构  中图分类号:TP273 文献标识码:A 文章编号:1009-914X(2016)30-0081
期刊
[摘 要]住宅施工管理包括签订合同、落实施工任务、进行施工前的准备工作、进行施工中准备工作、施工过程中的协调和控制、加强施工现场的平面控制、保障良好的施工环境以及组织工程交工验收工作等。建筑施工管理上存在的问题突现出来,应该引起高度关注。本文主要针对住宅施工管理工作中存在的一些问题进行分析,并提出相应的解决措施。  [关键词]住宅施工管理 问题 质量管理 解决措施  中图分类号:F84.6 文献标
期刊
[摘 要]为了研究风力发电机组故障原因制定切实可靠的检修策略,依据检修规程(DL/T7797—2001)对电气与控制设备着重分析,制定具体检修步骤。研究得出:PLC主机与相关通讯模块是风力发电厂根本,而保障安全链回路正常工作是检修工作的首要。  [关键词]检修;风电机组;电气;控制设备  中图分类号:TM315 文献标识码:A 文章编号:1009-914X(2016)30-0077-01  1 引
期刊
[摘 要]在星空星座观测中,夏季是最理想的时间。由于夏季天空较为晴朗,并且夏季气温适宜,适合在野外进行星空星座观测。从目前夏季星空星座观测来看,掌握夏夜星空星座的特点,对提高星空星座观测质量具有重要作用。因此,我们应从夏夜星空星座的特点入手,认真分析夏夜星空的主要标志、主要的星座构成以及星座分布的特点,并对夏夜星空所包含的星座数量及数量进行分析,掌握正确的观测重点,为夏季星空星座观测提供良好的理论
期刊
[摘 要]本文详细论述了用标准氯离子溶液检测离子色谱仪最小检测浓度时的最小检测浓度测量不确定度评定方法。  [关键词]不确定度;最小检测浓度;测量重复性  中图分类号:O657.7+5 文献标识码:A 文章编号:1009-914X(2016)30-0087-01  离子色谱,一种分析阴离子和阳离子的液相色谱方法,是高效液相色谱(HPLC)的一种。在日常检测中主要被用于环境样品的分析,包括地面水、饮
期刊
[摘 要]在电力供应过程中,变电站起着中转站的作用。为了确保变电站的建设质量,本文探讨了变电站工程的施工技术以及相应的管理措施。  [关键词]变电站工程;施工技术;施工管理  中图分类号:TM63 文献标识码:A 文章編号:1009-914X(2016)30-0079-01  前言  电力行业是我国的基础性产业,变电站作为电力工程的重要组成部分,加强变电站施工技术以及相应的管理水平能够大大提高工程
期刊
[摘 要]依托广域信息的应用,继电保护目前具有了更为明显的应用优势以及性能,在现今城市电力需求不断变化的今天具有更为积极的应用价值。在本文中,将就广域继电保护及其故障元件判别问题进行一定的研究。  [关键词]广域继电保护;故障元件;判别;  中图分类号:TM774 文献标识码:A 文章编号:1009-914X(2016)30-0082-01  1 引言  在电网运行中,继电保护具有保障电网运行安全
期刊
[摘 要]机械采油井免修期的高低是衡量一个油田管理水平的重要指标,同时也是反映油井开采效益、生产状况的重要指标,对油田开发有着重要意义。  [关键词]油井免修期;因素分析;改进对策  中图分类号:TE933.3 文献标识码:A 文章编号:1009-914X(2016)30-0088-01  1.影响油井免修期因素分析  1.1 管理因素  1.1.1 钻井过程中因管理原因可能导致井身质量差、井斜大
期刊