论文部分内容阅读
科学素养是指个人对科学所应了解的程度,包括对科学的本质和科学目标的认识,以及对更重要的科学思想和方法的理解和认同。青少年的科学素养反映了青少年对科学基本知识的了解、青少年的独立思维能力等,青少年的科学素养水平将决定了未来国家的综合实力。目前国际上比较著名的科学素养评测有TIMSS、NAEP和PISA三大评测系统,中国目前尚没有对青少年科学素养评测的完善系统。本研究的目的是建立适合青少年科学素养评测研究的数据库系统,探索数据挖掘方法在科学教育中的应用。 本研究选择台湾PISA-2006版样卷作为本次评测的问卷和数据源。并按照科学素养的三个维度对试题进行分类和编码,以便于在数据库中存储和进行数据挖掘。为支持网络评测,本研究采用电子量表的方式进行数据取样。用PHP语言搭建了一个青少年科学素养评测平台,将纸质评测问卷电子化,并运用数据库支持,实现被试在计算机平台上完成调查问卷。该平台的运用不仅可以提高采集效率,还有助于数据的提取、筛选、清理、填补缺失值、编码等一系列操作,方便后续在数据库中进行数据分析。随后用BI Dev studio对数据库进行建模,用决策树算法预测了各个维度分数的走势;用关联规则挖掘发现了学生的得分与学生背景中各个因素都有着密不可分的关系。 决策树挖掘结果显示,被试得分主要与院系、专业、高中分科和母亲文化程度四个因素有关,每个因素对各个的维度得分的预测有很大影响。关联规则挖掘结果显示,不同的父母受教育程度和职业属性对青少年科学素养的得分结果有很大影响,父母受教育程度越高,父母的职业为脑力活动的家庭,青少年科学素养的得高分的可能性较大;父母受教育程度越低,父母的职业为体力劳动的家庭,青少年科学素养得高分的可能性不大。 以上研究成果展示了用数据挖掘进行青少年科学素养评测研究的可行性,为青少年科学素养评测,乃至整个教育学领域的数据评测都提供了新的方法和视角。数据挖掘将成为一种新的评测手段,在教育学领域大放异彩。 本文的创新点是将数据挖掘算法应用到教育学中。目前国内对于科学素养的研究有很多,但是大部分还是停留在传统的分析手段,如利用SPSS、EXCEL等工具进行数据分析,分析维度较窄,且只能用于小体量的数据分析,对于较大的数据体量的分析有点力不从心;而数据挖掘正是用来处理大数据的,运用数据挖掘中的决策树分析预测了得分的可能走势,运用关联规则分析探索出了学生得分与背景因素之间的关联,这种分析方法科学、合理,逻辑缜密,丝丝入扣,有很高的应用价值,是目前国际上数据分析的热点。为教育评测提供了新的角度。