论文部分内容阅读
教育质量监测是一项涉及学科教育学、教育评价学、教育统计学、教育测量学和教育心理学等综合性、专业技术性很强的工作,许多地级市做质量检测常常遇到很多困难。
抽样监测适合国测省测
国家义务教育质量监测(简称“国测”)除了纸笔测评,还有学生问卷、教师问卷和校长问卷,主要调查影响学生学业水平(语文、数学、科學学科)的相关因素。现场测试工具主要用于体育、科学、艺术等学科的监测,通过学生的现场演示和项目参与,考查运动、操作、创作能力。国测样本采取分层不等概率方式抽取;每个省样本县(市、区)不少于6个,根据地理位置、城乡分布、学校类型等因素,采用按规模成比例概率抽样(PSS)方法,在样本县(市、区)抽取约不少于12所小学和不少于8所初中;在每所样本学校的四年级和八年级随机抽取约30名学生,每个省(区、市)抽取学生总数不少于3600名。国测的测评对象主要是省级区域。
省级义务教育质量监测(简称“省测”)目的、监测内容、监测方式和抽样方式基本上是模仿国测。最大差别是该省所有县(市、区)都参加,也就是说县(市、区)为全样本。每个县(市、区)抽取约12所小学和8所初中,四年级样本校随机抽取约30名学生,八年级样本校随机抽取约60名学生,一个县(市、区)的小学和初中抽样学生各约360人。省级监测的测评对象主要是地市区域。
国测和省测目的都是客观反映义务教育阶段学生学业质量、身心健康及变化情况,深入分析影响义务教育质量的主要原因,为转变教育管理方式和改进学校教育教学提供参考,引导社会树立正确的教育质量观,纠正以升学率作为评价学校和学生唯一标准的做法,推动义务教育质量和学生健康水平的不断提升。主要功能在于引领学科学业评价走向综合素质评价,水平评价转向诊断性评价,学科测试转向相关因素分析。国测和省测的反馈的主要对象分别是省和市,目的是引领市、县教育局领导树立全面的正确的“立德树人”教育质量观。国家、省级层面的学校和学生的总量极大,而且没有利害关系,所以,适合抽样监测。
市级监测采取抽样方式有局限性
地市级质量监测(简称“市测”)通常也采用抽样方式。一种模仿国测省测,采取分层抽样、随机抽样、等距抽样相结合的方法。一般各区县小学抽样12所左右,每校学生抽30人;初中抽样6所左右,每校学生60人。如果县区学校数较多,则增加一所抽样学校。一般来说,学校数少、学生数少的县区数据的信效度高,学校数多、学生数多的规模较大的区县数据的信效度低。因为不管学校规模大小,抽样学生都是30人或60人,对于一所学生数规模较小的学校,样本可以反映整体情况;对于学生数规模较大的学校,这些样本难以代表该学校。这样的抽样数据,市级层面数据分析报告具有较高的信效度,县级和校级数据的信效度则比较低。
样本学校结构和抽样学生的数量及其代表性,也直接影响监测的信度和效度。样本学校数量很少,又要能够代表不同办学性质、不同办学水平、不同办学规模、不同地理位置的学校,而我国义务教育又存在地域不均衡性,这样的样本学校很难选择,往往顾此失彼。
由于抽样学校数少,样本校的代表性很重要,不同类型学校的结构很敏感,样本校的结构稍有变化,就很有可能影响整个结论。在一次市级抽样监测中,有一个县区指数情况不太好,对样本学生分析发现,样本校中民工子弟学校多了一所,他们就归因到抽样不公平。事实上,这个县本来民工子弟学校就比较多。
最大的问题是这种抽样的监测数据的利用受到局限,由于样本的数量和结构问题,一些专项、深度的研究难以开展,也难以发挥质量监测诸多功能。
学校需要高价值的监测数据
国测和省测组织部门具有资源优势、理念优势、技术优势、专家优势和经费优势。但县级教研部门普遍没有配置教育质量评价机构,几乎没有专业的评价技术人员,监测的观念比较传统,评价量具研发能力不够,不具备对辖区学校实施教育质量综合评价监测能力。但学校是实施综合素质评价的主体,如果学校层面没有科学的、准确的、全面的质量监测数据,教育教学的改进就无从下手,综合素质评价很容易成为空话。只有学校的评价发生真实的变化,教育监测才发挥作用。
市级监测部门,在政策、技术、人员、经费、管理等方面都具有得天独厚的优势。所以,市级质量监测必须一杠子插到学校,每次监测都能为一线学校直接服务。县级教育行政部门和教研部门无须自己做质量监测,可以直接分享、运用市级监测数据。如此,不仅解决了监测技术的困难,还可以把工作重点单位放在解读数据、研究数据,基于数据做深入的研究,高效发挥监测的督导功能和诊断功能。
市测适合采取学校全测和学生全测
在国、省、市、县、校五级中,市级质量监测是本土化最重要的监测,既有行政功能,也有学术研究功能,利害关系不高不低。如果采取学校和学生全测,就可以构建出三级监测网络,即国测和省测侧重监测内容的导向、监测技术的研究,具有宏观性和高层性;市测侧重区域教育质量评估功能和服务功能;县校两级侧重监测数据应用和诊断功能。
提高数据的信效度。质量监测中,抽样的技术要求也很高,需要专门测软件,最终相关指数计算也非常重要,一不小心很可能会导致数据偏差很大,但绝大部分地市级监测工作者缺乏这方面的数据处理技术。采取学校全测和学生全测方式,不仅仅在数据可靠性上显著优于抽测,而且不需要数据层层转化,直接分类统计就行,避开了数据统计分析技术的困难,弥补了地市级监测人员的专业技术的短板,保证了各层次、各类别的群体统计分析结果的科学性和准确性。采取学校和学生全测,不仅仅保证了所有县市区的数据的信效度,也保证了所有学校数据的信效度。
增加作假的成本。虽然市测的主要有导向、评估和诊断功能,在实际工作中发现,各县(市区)教育局领导特别关注各指数的排名排序和进退情况,很在乎监测的评估功能。在省测中,我们发现有个别县市区作假现象;在市测中,也发现有个别学校作假现象。在抽样监测中,一个学校只有一个考场,很容易作假。采取学校全测和学生全测,县域和学校作假的难度、成本和风险都明显加大;万一出现个别学校作假现象,对整个县区的影响也不会很大。
市级全测是可行的。采取学校抽样和学生抽样,其目的是减少人力物力的投入。进入大数据时代,网络阅卷和大数据采集处理分析技术非常成熟,学生问卷、教师问卷、校长问卷和学科的客观题都无须人力批改,地市级质量监测完全具备技术条件。
市级全测数据是一种“新能源”
在大数据时代,数据的数量、结构和品质决定了数据的价值。大数据贵在应用,应用越广越多,其价值越大;数据的应用性受到局限,数据的价值也就受到局限。
全测可以构建成三级监测数据体系。从层次上,可以形成市级、县级和校级三级报告;有些大县,在县校之间设有镇街教育局或学区(教育局派出机构),基于全测数据,可以生成镇街教育局报告或学区报告。从研究对象上,可以生成市级全体学生报告、不同学校群体报告、不同学生群体报告、不同教师群体报告和不同家长群体报告。学校群体可以形成小规模学校、乡村学校、民工子弟学校、留守儿童居多的学校和流动儿童居多的学校报告等;学生群体方面可以形成留守儿童、流动儿童的报告,学业表现优秀、达标和未达标的学生的专题报告;教师群体方面可以形成不同年龄段教师、不同职称教师和不同层次名师专题报告;家长层面可以形成留守儿童家长、流动儿童家长、低收入家庭等专题报告。基于这些大数据的实证研究成果都能为当地政府和教育行政部门制定政策服务。
学校可以做精细化诊断和学生个性化指导。基于全测,学校要科学正确使用数据,不能用学科成绩对教师、对学生、对班级排名排序。上级部门提供给学校的数据要有所筛选,要有特殊处理。全测数据分析可以做到班级层面、教师层面、不同性别学生群体、不同学业水平等第的学生群体,实施差异化教育。基于全测数据,也可以对学生个体做个性化全面体检分析,有利于因材施教和个性化教育,有利于学校做全面挖掘和深度挖掘,开展校本化、精细化、专题化数据驱动的实证研究。
教育大数据是区域和学校教育发展的新型竞争力,采用学校全测和学生全测,可以让市测的功能至善至美,更好地实现质量监测的最终目的。
抽样监测适合国测省测
国家义务教育质量监测(简称“国测”)除了纸笔测评,还有学生问卷、教师问卷和校长问卷,主要调查影响学生学业水平(语文、数学、科學学科)的相关因素。现场测试工具主要用于体育、科学、艺术等学科的监测,通过学生的现场演示和项目参与,考查运动、操作、创作能力。国测样本采取分层不等概率方式抽取;每个省样本县(市、区)不少于6个,根据地理位置、城乡分布、学校类型等因素,采用按规模成比例概率抽样(PSS)方法,在样本县(市、区)抽取约不少于12所小学和不少于8所初中;在每所样本学校的四年级和八年级随机抽取约30名学生,每个省(区、市)抽取学生总数不少于3600名。国测的测评对象主要是省级区域。
省级义务教育质量监测(简称“省测”)目的、监测内容、监测方式和抽样方式基本上是模仿国测。最大差别是该省所有县(市、区)都参加,也就是说县(市、区)为全样本。每个县(市、区)抽取约12所小学和8所初中,四年级样本校随机抽取约30名学生,八年级样本校随机抽取约60名学生,一个县(市、区)的小学和初中抽样学生各约360人。省级监测的测评对象主要是地市区域。
国测和省测目的都是客观反映义务教育阶段学生学业质量、身心健康及变化情况,深入分析影响义务教育质量的主要原因,为转变教育管理方式和改进学校教育教学提供参考,引导社会树立正确的教育质量观,纠正以升学率作为评价学校和学生唯一标准的做法,推动义务教育质量和学生健康水平的不断提升。主要功能在于引领学科学业评价走向综合素质评价,水平评价转向诊断性评价,学科测试转向相关因素分析。国测和省测的反馈的主要对象分别是省和市,目的是引领市、县教育局领导树立全面的正确的“立德树人”教育质量观。国家、省级层面的学校和学生的总量极大,而且没有利害关系,所以,适合抽样监测。
市级监测采取抽样方式有局限性
地市级质量监测(简称“市测”)通常也采用抽样方式。一种模仿国测省测,采取分层抽样、随机抽样、等距抽样相结合的方法。一般各区县小学抽样12所左右,每校学生抽30人;初中抽样6所左右,每校学生60人。如果县区学校数较多,则增加一所抽样学校。一般来说,学校数少、学生数少的县区数据的信效度高,学校数多、学生数多的规模较大的区县数据的信效度低。因为不管学校规模大小,抽样学生都是30人或60人,对于一所学生数规模较小的学校,样本可以反映整体情况;对于学生数规模较大的学校,这些样本难以代表该学校。这样的抽样数据,市级层面数据分析报告具有较高的信效度,县级和校级数据的信效度则比较低。
样本学校结构和抽样学生的数量及其代表性,也直接影响监测的信度和效度。样本学校数量很少,又要能够代表不同办学性质、不同办学水平、不同办学规模、不同地理位置的学校,而我国义务教育又存在地域不均衡性,这样的样本学校很难选择,往往顾此失彼。
由于抽样学校数少,样本校的代表性很重要,不同类型学校的结构很敏感,样本校的结构稍有变化,就很有可能影响整个结论。在一次市级抽样监测中,有一个县区指数情况不太好,对样本学生分析发现,样本校中民工子弟学校多了一所,他们就归因到抽样不公平。事实上,这个县本来民工子弟学校就比较多。
最大的问题是这种抽样的监测数据的利用受到局限,由于样本的数量和结构问题,一些专项、深度的研究难以开展,也难以发挥质量监测诸多功能。
学校需要高价值的监测数据
国测和省测组织部门具有资源优势、理念优势、技术优势、专家优势和经费优势。但县级教研部门普遍没有配置教育质量评价机构,几乎没有专业的评价技术人员,监测的观念比较传统,评价量具研发能力不够,不具备对辖区学校实施教育质量综合评价监测能力。但学校是实施综合素质评价的主体,如果学校层面没有科学的、准确的、全面的质量监测数据,教育教学的改进就无从下手,综合素质评价很容易成为空话。只有学校的评价发生真实的变化,教育监测才发挥作用。
市级监测部门,在政策、技术、人员、经费、管理等方面都具有得天独厚的优势。所以,市级质量监测必须一杠子插到学校,每次监测都能为一线学校直接服务。县级教育行政部门和教研部门无须自己做质量监测,可以直接分享、运用市级监测数据。如此,不仅解决了监测技术的困难,还可以把工作重点单位放在解读数据、研究数据,基于数据做深入的研究,高效发挥监测的督导功能和诊断功能。
市测适合采取学校全测和学生全测
在国、省、市、县、校五级中,市级质量监测是本土化最重要的监测,既有行政功能,也有学术研究功能,利害关系不高不低。如果采取学校和学生全测,就可以构建出三级监测网络,即国测和省测侧重监测内容的导向、监测技术的研究,具有宏观性和高层性;市测侧重区域教育质量评估功能和服务功能;县校两级侧重监测数据应用和诊断功能。
提高数据的信效度。质量监测中,抽样的技术要求也很高,需要专门测软件,最终相关指数计算也非常重要,一不小心很可能会导致数据偏差很大,但绝大部分地市级监测工作者缺乏这方面的数据处理技术。采取学校全测和学生全测方式,不仅仅在数据可靠性上显著优于抽测,而且不需要数据层层转化,直接分类统计就行,避开了数据统计分析技术的困难,弥补了地市级监测人员的专业技术的短板,保证了各层次、各类别的群体统计分析结果的科学性和准确性。采取学校和学生全测,不仅仅保证了所有县市区的数据的信效度,也保证了所有学校数据的信效度。
增加作假的成本。虽然市测的主要有导向、评估和诊断功能,在实际工作中发现,各县(市区)教育局领导特别关注各指数的排名排序和进退情况,很在乎监测的评估功能。在省测中,我们发现有个别县市区作假现象;在市测中,也发现有个别学校作假现象。在抽样监测中,一个学校只有一个考场,很容易作假。采取学校全测和学生全测,县域和学校作假的难度、成本和风险都明显加大;万一出现个别学校作假现象,对整个县区的影响也不会很大。
市级全测是可行的。采取学校抽样和学生抽样,其目的是减少人力物力的投入。进入大数据时代,网络阅卷和大数据采集处理分析技术非常成熟,学生问卷、教师问卷、校长问卷和学科的客观题都无须人力批改,地市级质量监测完全具备技术条件。
市级全测数据是一种“新能源”
在大数据时代,数据的数量、结构和品质决定了数据的价值。大数据贵在应用,应用越广越多,其价值越大;数据的应用性受到局限,数据的价值也就受到局限。
全测可以构建成三级监测数据体系。从层次上,可以形成市级、县级和校级三级报告;有些大县,在县校之间设有镇街教育局或学区(教育局派出机构),基于全测数据,可以生成镇街教育局报告或学区报告。从研究对象上,可以生成市级全体学生报告、不同学校群体报告、不同学生群体报告、不同教师群体报告和不同家长群体报告。学校群体可以形成小规模学校、乡村学校、民工子弟学校、留守儿童居多的学校和流动儿童居多的学校报告等;学生群体方面可以形成留守儿童、流动儿童的报告,学业表现优秀、达标和未达标的学生的专题报告;教师群体方面可以形成不同年龄段教师、不同职称教师和不同层次名师专题报告;家长层面可以形成留守儿童家长、流动儿童家长、低收入家庭等专题报告。基于这些大数据的实证研究成果都能为当地政府和教育行政部门制定政策服务。
学校可以做精细化诊断和学生个性化指导。基于全测,学校要科学正确使用数据,不能用学科成绩对教师、对学生、对班级排名排序。上级部门提供给学校的数据要有所筛选,要有特殊处理。全测数据分析可以做到班级层面、教师层面、不同性别学生群体、不同学业水平等第的学生群体,实施差异化教育。基于全测数据,也可以对学生个体做个性化全面体检分析,有利于因材施教和个性化教育,有利于学校做全面挖掘和深度挖掘,开展校本化、精细化、专题化数据驱动的实证研究。
教育大数据是区域和学校教育发展的新型竞争力,采用学校全测和学生全测,可以让市测的功能至善至美,更好地实现质量监测的最终目的。