基于数据挖掘的河北省高考数据分析研究

被引量 : 0次 | 上传用户:sonicff8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息技术的飞速发展使得各行各业积累了大量的数据,随着管理信息化的推进和行业业务需求的增大,人们并不满足于对现有数据的简单查询和分析,传统的数据管理方法已不能深入探索数据背后的含义。数据挖掘技术应运而生,该技术就是帮助人们从海量数据中提取有效的、隐含的、潜在有用的知识以优化和促进相应行业的信息化管理和发展。经过不到二十年的发展,数据挖掘技术已经在诸多领域得到了广泛的应用,也逐步在教育行业中发挥一定作用。教育信息化的深入推进给我国教育行业带来了巨大变革,现代化的信息技术管理已渗透到教育领域的各个环节。每年高考过后,教育考试部门都会形成大量的高考数据,包括考生信息、考生成绩、报考信息等等。河北省自引进海云天高考阅卷系统以来,一直实施高考网上阅卷,进一步加强教育考试信息化管理工作,规范考试信息数据的管理和挖掘应用。高考阅卷的信息化管理和实施使得相应的教育考试部门积累了大量的高考数据,这其中包括多年的考生报考数据、考生成绩数据、考生志愿数据等等,本文将数据挖掘技术中的关联规则挖掘和聚类分析引入到高考数据分析中,在高考数据分析系统的基础之上对数据进行二次挖掘,进而发现通过现有系统中传统统计学、教育测量学等技术理论无法挖掘的潜在有用知识,以期对全省的高中教育起到一定的指导作用。Weka数据挖掘平台是目前最为主流的通用数据挖掘工具之一,其强大的数据挖掘功能和集成的众多通用挖掘算法得到了许多理论研究者和应用开发人员的青睐。本文综合考虑其通用性、强大的算法合成等优势,最终选用该平台,以河北省近几年普通高考招生考试模拟样本数据为基础,综合运用高考数据分析系统和以Weka平台为主要依托的数据挖掘技术,将数据库、计算机编程语言与数据可视化相结合,对河北省高考数据进行深入的挖掘和分析,试图寻找以高考成绩分析为主要内容的高考数据挖掘方法和模式:①依托已开发的高考数据分析系统进行模拟样本数据准备和预处理,将提取的数据在Weka平台中运用数据挖掘技术对全省高考数据进行分析、挖掘,为全省高中教育教学和管理提供决策依据。同时也为教育考试管理部门提供方便快捷的考试数据分析方式。②结合模拟考生报名信息和成绩信息,在高考数据分析系统中进行数据预处理,转化为数据挖掘工具Weka所能处理的数据格式,之后进行关联规则挖掘和聚类分析处理,发现影响考生成绩的潜在因素。这为区域及学校教育的发展提供一定参考。同时通过Weka挖掘,以英语学科为例,发现科目试题间的关联和考生答题趋势。通过本研究,比较深入地对全省高考数据进行了挖掘和解释,获得以学科答题关联和科目得分聚类为主的潜在有用信息。研究中综合运用教育统计分析和数据挖掘技术,具有较强的理论价值,对全省高中教育也具有一定的指导意义和实践价值。
其他文献
水库移民安置工作是工程建设的重点,移民安置妥当与否直接关系到库区的长治久安和可持续发展。本文根据云南省开远市大庄水库的实际情况,结合国家相关移民安置原则,在项目区
现代社会是一个危机频发的社会,几乎每一天在全球范围内都会有一些由自然或人为因素导致的危机事件发生。面对这种情况,许多国家都建立了自己应对危机的机制,不少国际组织也同样
中等职业教育作为我国高中阶段教育的重要组成部分,是全面提高国民素质,增强民族产业发展实力,提升国家核心竞争力、构建和谐社会以及建设人力资源强国的基础性工程。中等职业教
地下水数值模拟在与地下水相关的多个领域得到广泛应用,参数灵敏度分析能有效提高模拟结果的精度。最初的局部灵敏度分析方法只考虑了单个参数的影响,忽略了参数的共同作用;
本文旨在探讨沙盘游戏疗法(沙游,箱庭疗法,Sandplay Therapy)在情侣咨询中的应用。整个研究分为实证研究和个案研究两个部分:研究一不同的依恋类型对爱情各指标的影响及其沙盘
稻盛和夫是当今世界集哲学与经营于一身的伟大企业家,其经营哲学具有较强的实践指导性。本文详细阐述了稻盛先生经营哲学的主要内容,指出稻氏“以心为本”经营对我国现代企业
<正>以资本为纽带构成的委托代理关系是企业集团的财务控制产生的基础。资本层级结构在逐步延伸,集团公司对下属成员单位的约束力却在不断减弱。保持集团整体目标一致,实现集
<正>电子控制制动系统(Electronically Controlled Brake System,EBS)是新一代制动系统产品。该系统将ABS和常规制动系统集成于一体,通过电子控制来实施制动,是对基于传统意
基于"健康和谐"的水能资源开发与运行管理评价指标体系,分析了李仙江流域水能资源利用的特点;考虑河流开发服务功能、健康河流生态环境补偿功能与和谐社会经济发展功能3个属
前言肝脏有着较丰富的自主神经分布,神经末梢分布于胆管、窦旁隙、肝细胞、血管内皮及血管壁,神经调节在肝脏的肝细胞再生、血流调节、物质代谢、肝细胞胆汁合成及排泄等方面