《走向优质——中国幼儿园教育质量评价标准》的测量学属性分析

来源 :学前教育研究 | 被引量 : 0次 | 上传用户:dama5011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要] 幼儿园教育质量评价标准的编制具有重要的理论与实践意义。中国学前教育研究会组建了一个包含了來自国内6所高校的专家的跨学科研究团队,遵循严谨的测量学研制程序,经过两年扎实的研究,编制了《走向优质——中国幼儿园教育质量评价标准》(简称《优质标准》)。为验证该标准的有效性,课题组采用分层抽样的方法,在位于我国不同区域的5个省区抽取了不同性质与等级的城乡幼儿园共计100所,采用《优质标准》进行质量评价,同时从300个样本班级中随机抽取了1670名儿童(男女各半),对其语言、数学认知、情感社会性发展水平进行测评。基于幼儿园教育质量和儿童发展水平测评数据,课题组对《优质标准》进行了信效度分析。结果显示,《优质标准》总体及其各领域内部一致性均达到较高水平;绝大部分项目具有良好的区分度;《优质标准》具有良好的结构效度,包含两个潜在的质量因子,分别是课程教学与学习环境、管理支持与师资保障;幼儿园教育质量评价结果与儿童发展水平测评结果总体上呈显著相关,不同质量领域与儿童不同发展领域之间的相关性存在一定差异。综合以上证据表明,《优质标准》是适用于我国幼儿园教育情境的有效评估工具,其评价结果是可靠、可信的。
  [关键词] 《优质标准》;测量学属性;信度;效度
  一、前言
  (一)学前教育质量评价工具研制的价值
  幼儿园教育质量对儿童的学习与发展至关重要。[1][2][3]当前,我国学前教育正处于从高速度增长向高质量发展转型的关键期。2018年,我国幼儿园教育普及率达到81.7%,在园儿童超过4656万。[4]面对如此庞大的学前儿童群体,如何科学地评价幼儿园教育质量,引领广大幼儿教育工作者不断改进教育实践,有效促进儿童的学习和发展,成为重要而紧迫的任务。众所周知,幼儿园教育质量评价工具的研制,是一项专业性、科学性很强的工作。自20世纪80年代以来,我国各地陆续建立了以教育行政部门为主导的幼儿园分等定级体系和评估标准。但这些评估标准体系基本上是建立在地方实践经验的基础上,往往未经过科学的测量学研制程序和信效度检验,存在许多明显的缺陷,如侧重静态要素的评价、对动态的教育过程的评价不足,评价信息采集渠道单一、可靠性不足,评分方法不够科学合理等。[5][6][7]在此背景下,研制一份适宜我国文化和学前教育情境、科学有效的幼儿园教育质量评价工具,具有重要意义。
  (二)学前教育质量评价工具研究的国际趋势
  从国际范围来看,对学前教育质量评价工具的研究大致呈现如下特征。第一,评价功能与评价工具相匹配。出于学前教育机构管理与政策调控目的的评价,往往是从学前教育机构整体进行质量评价,评价内容侧重机构的条件保障(物质环境、经费、师资)、管理运行的合规性、保教工作的规范性。比如,美国各州的QRIS体系、美国幼教协会的高质量托幼机构认证标准、德国的日托机构质量标准、新加坡的SPARK等。出于研究性目的和教育过程质量提升目的的评价,往往是以班级为单位进行观察评价,评价内容侧重点各异,如ECERS系列量表关注的是幼儿的学习环境,[8][9]ECERS-E主要是对几个领域的课程进行评价,[10]CLASS量表聚焦于师幼关系与互动的评价,[11]SSTEW、MOVERS则是对班级的环境、课程、教学能否形成对儿童多领域(语言、认知、情感社会性、运动)核心素养的有效支持进行评价。[12][13]第二,信效度验证方法的多元性。科学的质量评价工具是建立在严格的、不断累积的信效度验证的基础上的。在量表研制过程中,往往通过采集一定规模的样本数据,采用现代心理与教育测量学技术对这些工具的信、效度进行探索。如,通常采用克隆巴赫系数估计量表各项目间的内部一致性;[14]因幼儿园教育质量评价是多人参与的多维度评价,已有研究采用多元概化理论和项目反应理论对测评的信度展开了深入探索;[15][16][17]效度研究方面,通常采用探索性因素分析(EFA)或验证性因素分析(CFA)对评价工具结构效度进行探索,[18]尤其重视质量工具的测评结果与儿童发展结果(如语言、认知、情感社会性)的校标关联效度或预测效度。[19][20][21]
  (三)《优质标准》的研发
  中国学前教育研究会(以下简称“研究会”)作为全国学前教育研究者和实践者的专业性组织,有力量也有使命引领全国学前教育科学研究和提升其质量。2018年初,研究会设立了“十三五”重点项目“中国优质幼儿园评价标准研究”,整合国内多所高校的研究力量,组建了一个包括学前教育学、儿童发展心理学、教育测量与统计学等领域专家的跨学科研究团队,开始进行幼儿园优质标准的研制工作。研制这一标准的初衷是引领全社会更新幼儿园教育质量观念,支持幼儿园教师专业发展,促进幼儿园的质量提升,为政府部门的学前教育决策提供参考,同时,研究会可以依据该标准展开学前教育质量相关的科学研究以及优质幼儿园认证。
  经过两年扎实的工作,课题组研制出《走向优质——中国幼儿园教育质量评价标准》(以下简称《优质标准》)。研究团队基于人类发展生态系统理论、发展适宜性实践理论、需求层次理论等,广泛借鉴了多个国家、专业组织的学前教育机构质量评价标准以及ECERS系列、CLASS、SSTEW、MOVERS等评价工具的质量观念与指标框架,结合中国国情以及学前教育研究与实践,构建起具有中国特色的《优质标准》质量概念与指标框架。在评价指标编写的过程中,研究团队坚持了以儿童为本、系统思维、动态思维、层层递进、问题导向等基本原则。
  2018年12月,《优质标准》草稿基本完成,并召开了境内外专家咨询会,征求了来自美国、英国、中国香港的多位学前教育质量评价领域资深专家的意见和建议,《优质标准》的质量概念、指标框架、评价方式等得到了专家们的肯定。2019年3月、6月、9月,研究团队分别在四川成都、浙江杭州、上海进行了三次幼儿园现场试测,基于每次试测的数据分析结果,研究团队对标准的项目结构、指标数量和内容不断进行调整和优化。2019年10月,《优质标准》正式定稿,2019年10月至12月,为验证《优质标准》的测量学属性,研究团队在全国抽样了100所幼儿园和1670名儿童进行测评,基于测评数据对该标准的测量学属性进行了基本分析。   二、研究方法
  (一)抽样说明
  1. 幼儿园和班级抽样。
  课题组采用分层抽样的方法,在广西、陕西、吉林、江苏和浙江5个省区的市区、城郊、县镇和农村,分别抽样公办和民办不同性质、不同等级幼儿园共计100所,幼儿园样本分布情况如表1所示。每所幼儿园各随机抽样大、中、小各1个班级,共计300个班级。评估员团队运用《优质标准》对样本幼儿园和班级进行了质量评估。
  2. 儿童抽样。
  为检验《优质标准》的实证效度,幼儿园质量测评当日在每个样本班级随机抽样6名儿童(男女各半),运用PPVT、REMA、情感社会性量表对儿童进行发展水平测试。剔除无效样本,最终从100所幼儿园300个班级共获得了1670名儿童的发展测评数据,儿童样本分布情况如表2所示。需要说明的是,一名儿童需参与三份量表测评,但并非每位儿童均完成了所有测评。最终,实际参与PPVT测评的儿童1669名,有效率为99.94%;参与REMA测评的儿童1594名,有效率为95.45%;参与情感社会性测评的儿童1548名,有效率为92.69%。
  (二)评价工具
  1. 幼儿园教育质量评价:《优质标准》。
  (1)《优质标准》的结构与内容。
  用于本轮测试的《优质标准》包含5个质量领域、28个评价项目,具体情况如下:一是管理引领(6个项目),二是环境支持(5个项目),三是课程促进(9个项目),四是师资保障(4个项目),五是家园社区合作(4个项目)。每个项目由若干子项目组成,每个子项目又包含了若干个不同等级的精细评价指标。如表3所示,领域一“管理引领”的项目2理念与规划,由2个子项目组成;其中子项目2.1理念与愿景有1~7个评分等级,每个等级下有若干不等的精细指标组成,如在不适宜等级(1分指标)有3个精细指标2.1.1a,2.1.1b,2.1.1c。统计结果显示,《优质标准》共包含80个子项目、880个精细指标。
  需要特别指出的是,《优质标准》综合了已有评价工具的共性内容和先进理念,兼顾了幼儿园和班级两个层面的质量评价。在幼儿园整体层面,主要对幼儿园管理、总体环境、课程建设、师资队伍、家园社区合作等方面进行评价;在班级层面,则对班级内部的学习环境(物质环境与心理环境)、各领域课程的实施(健康、语言、社会、科学、艺术)进行评价,关注环境创设、活动安排、教学互动对幼儿各领域核心经验获得的支持与促进。
  (2)评分规则说明。
  首先,精细指标评分规则。每个精细指标均应进行评价,评价结果为“是”或“否”(“不适用”情况除外)。
  其次,子项目评分规则。子项目采用7点Likert量表进行评分:1分=不適宜,3分=合格,5分=良好,7分=优秀。子项目评分采取由低到高逐级推理的原则,依据精细指标测评结果和评分推理规则(如表4所示),赋予子项目相应等级计分(1~7分之间)。
  第三,项目的计分方法。项目得分为所含多个子项目得分的均分,在1~7分之间变化(保留2位小数)。
  2. 儿童发展测评工具。
  评估团队采用3个应用广泛、具有良好测量学属性的儿童发展测评工具,包括PPVT(Peabody Picture Vocabulary Test,《皮博迪图片词汇测验(修订版—甲式)》),[22]REMA-SF(Research-based Early Mathematics Assessment-Short Form,《研究型早期数学测验—短版》)[23]和《情感与社会性个别测试》,[24]从语言/词汇、数学认知和情感社会性3个方面对儿童发展水平进行测评。PPVT采用0~1计分方式,作答正确为“1”,作答错误为“0”。REMA-SF每个项目计分编码包含是否正确和采用的策略等,该研究主要采用了正确作答与否计分方式,正确为“1”,错误或没有作答为“0”或“9”。REMA-SF相关研究显示其具有较好的信效度,较适合测评学前儿童数学能力。[25][26]情感社会性等问卷依据幼儿的作答进行编码,中性为“1”、积极为“2”和消极为“0”。
  (三)测评过程
  正式测评开始前,课题组对参与测评的评估员进行了统一、严格的测评培训,包括测评方法、测评指标解读、现场试测培训等。已有研究结果表明,两人一组进行测评是经济有效的。[27]本研究中,幼儿园(班级)的质量测评采用两人一组,各自独立评分。待测评结束后两人再进行讨论,做出最后的测评结果。每所幼儿园的测评时间一般从早上8:00至下午4:00。本轮测评中,《优质标准》的评价者间一致性百分比为0.819~0.986,达到了可接受水平。
  在幼儿园质量测评当日,由儿童发展测评人员在幼儿园对抽样儿童进行一对一测评。具体而言,分别对每位儿童依次进行PPVT、情感社会性和REMA-SF测评。测评指导语和流程严格按照各量表说明进行。每个工具的测评时间一般为10~20分钟;一名儿童参与三份工具的测评时间一般为30~60分钟(视儿童年龄与反应时间而异)。如测评过程中儿童疲劳、注意力下降,让儿童适当休息后继续。所有参与测评的儿童,均已取得其父母书面同意。
  (四)数据分析
  数据分析采用SPSS 26.0和R软件进行处理。
  三、研究结果与分析
  (一)内部一致性信度
  《优质标准》总体内部一致性和各个领域内部一致性分析结果如表5所示。结果显示,总体内部一致性α=0.926;各领域的内部一致性α系数在0.554~0.934之间。相对来说,领域四的内部一致性α系数偏低,领域五的内部一致性α系数也低于0.7,一致性α系数较高的是领域三。内部一致性系数与测验长度有关,增加项目数可以提高内部一致性,但更重要的是提高项目编制质量。分析结果表明,领域四、五的评价项目和指标的编制质量需要进一步提升。   [2][40]李克建.中國托幼机构教育质量评价研究[M].北京:北京师范大学,2017.
  [3]秦金亮,等.基于证据的学前教育需求与质量研究[M].北京:北京师范大学出版社,2018.
  [4]教育部.2018年全国教育事业发展统计公报[EB/OL].(2019-07-24)[2020-04-18].http://www.moe.gov.cn/jyb_sjzl/sjzl_fztjgb/201907/t20190724_392041.html.
  [5]刘焱.试论托幼机构教育质量评价的几个问题[J].学前教育研究,1998(03):14-17.
  [6]戴双翔,刘霞.我国现行托幼机构教育质量评价工具研究[J].学前教育研究,2003(01):39-41.
  [7]刘丽湘.当前我国幼儿园教育质量评价工作的误区及调整策略[J].学前教育研究,2006(01):85-87.
  [8]HARMS T, CLIFFORD R M, CRYER D. Early childhood environment rating scale-revised version (ECERS-R) [M]. New York: Teachers College Press,1998.
  [9]HARMS T, CLIFFORD R M, CRYER D. Early childhood environment rating scale(ECERS-3)[M]. New York: Teachers College Press,2015.
  [10]SYLVA K, SIRAJ-BLATCHFORD I, TAGGART B. ECERS-E: the four curricular subscales extension to the early childhood environment rating scale(ECERS-R) 4th Edition[M]. New York: Teachers College Press,2010.
  [11]PIANTA R C, LA PAR KM, HAMRE B K. Classroom assessment scoring system (CLASS) manual, K-3[M]. Baltimore, MD: Brookes,2008.
  [12]IRAM S, DANISE K, EDWARD M.持续共享思维和情绪情感健康评量表(SSTEW)[M]. 詹慧妮,朱珊,译.南京:南京师范大学出版社,2019.
  [13]CAROL ARCHER, IRAM SIRAJ.运动环境评量表(MOVERS)[M].张丹丹,刘萌然,译.南京:南京师范大学出版社,2019.
  [14][19][32][33][39][41][44][45][54]LI K, HU B Y, PAN Y, et al. Chinese early childhood environment rating scale(trial) (CECERS): a validity study[J]. Early Childhood Research Quarterly,2014,29(3):268-282.
  [15][27]CHEN D, HU B Y, FAN X, et al. Measurement quality of the Chinese early childhood program rating scale: an investigation using multivariate generalizability theory[J]. Journal of Psychoeducational Assessment,2014,32(3):236-248.
  [16]BATRK R, IIKOLU N. Analyzing process quality of early childhood education with many facet rash measurement model[J]. Educational ences: Theory and Practice,2008,8(1):25-32.
  [17]陈德枝,秦金亮,李克建.托幼机构教育质量评价中评委偏差的多侧面Rasch分析[J].心理科学,2016(03):628-636.
  [18][34][36]CASSIDY D J, HESTENES L L, HEGDE A, et al. Measurement of quality in preschool child care classrooms: an exploratory and confirmatory factor analysis of the early childhood environment rating scale-revised[J]. Early Childhood Research Quarterly,2005,20(3):345-360.
  [20]SYLVA K, SIRAJ-BLATCHFORD I, TAGGART B, et al. Capturing quality in early childhood through environmental rating scales[J]. Early Childhood Research Quarterly,2006,21(1):76-92.
  [21]HOWARD S J, SIRAJ-BLATCHFORD I, MELHUISH E C, et al. Measuring interactional quality in pre-school settings: introduction and validation of the Sustained Shared Thinking and Emotional Wellbeing (SSTEW) scale[J]. Early Child Development
其他文献
[摘 要]幼小衔接阶段,为帮助学生更快地适应数学学习,数学绘本发挥了巨大的作用:借助精彩的数学绘本,可以激发学生的学习兴趣;选择合适的数学绘本,可以挖掘潜在的教学资源;灵活利用数学绘本,可以更好地开展数学教学。  [关键词]数学绘本 幼小衔接 学习兴趣 潜在资源 数学教学  [中图分类号] G623.5 [文献标识码] A [文章编号] 1007-9068(2016)09-023  李吉林老师指出
摘 要:初中计算机课已改名为信息技术课,被国家列入必修课教学计划,并占有一定的重要位置,因本学科具有许多与众不同的性质,其教学方法也应与其他学科有所不同,我将围绕如何使中学生在有限的时间内更好地学习计算机基础知识和基本操作技能,培养学科素质,归纳性地阐述了几种关于教学法的教学体会。   关键词:初中 信息技术 教学方法    自从计算机进入到初中生的课堂,在短短的十来年,学科的地位,学习的内容,指
提高语文课堂效率是一个老话题了,而如何提高语文课堂效率,至今还没有圆满的答案。这里我根据本人的教学实践,谈几点粗浅的认识。    一、内容要讲到点子上    语文教学要主则详,次则略,不可平均用力,或按照“作者介绍、时代背景、段落大意、中心思想、写作特点”这种八股味很浓的程式化教学方式进行教学,这样就难以培养能力,发展智力,教学效率必然低下。教师必须做到,“任它千瓢水,我只取一瓢饮。”即紧抓住课文
建设一个优秀的班集体,是每个班主任执著追求的目标,它的重要性不必多言。那么,怎样建设一个优秀的班级呢?     一、培养良好的班集体需要良好的班风、学风    能否形成一个积极向上、努力学习、团结和睦的集体是至关重要的。只有在良好的班集体中,教师开展教育和教学活动,才能收到较好效果。在实践中要狠抓班风建设,特别到了初三如果班风不正,学风不浓,师生怨声载道,前面两年的努力就要付之东流。当然良好的班集
摘 要:逆反心理是人们对待事物的一种特殊态度,它在青少年的身上表现得较为明显。逆反心理无论是对青少年自身还是对家庭、对社会都会产生严重的负面影响。教育者应积极探索有效的教育方法,对青少年的逆反心理进行正确的疏导教育,促进青少年的健康成长。  关键词:青少年 逆反心理 心理机制 原因 疏导    一、青少年逆反心理产生的原因    逆反心理无论是对青少年自身还是对家庭、对社会都会产生严重的负面影响。
[摘 要]构建科学完善的评价体系是落实立德树人、五育并举的有效路径,也是促进学生核心素养发展的重要抓手。东阳市吴宁第五小学基于多年来“生长教育”的探索,构建了“五色葵花”学生核心素养评价体系,旨在落实课程育人、全面发展的教育目标,让每一个学生都能因此而成为学习的主人,保持学习、保持生长。  [关键词]核心素养;生长教育;评价体系;校本  [中图分类号] G627 [文献标识码] A [文章编号
化学是一门以实验为基础的学科,实验教学可以激发学生学习化学的兴趣,帮助学生形成化学概念,获得化学知识和实验技能,培养观察和动手能力,还有助于培养学生实事求是、严肃认真的科学态度和科学的学习方法。充分认识实验教学在化学教学中的地位和作用,切实采取措施加强实验教学,是提高化学教学质量的重要环节。结合自己的教学实践,谈谈在初中化学教学中加强实验教学的做法和体会。  一、端正思想,充分认识实验教学  初中
数学教学活动不能简单地依赖于记忆和模式,要以更好地促进学生的发展为中心,在教学中教师要善于培养学生自主探究意识,通过教学方式和学习方式的转变,使学生能够主动参与、不断探究,获得自主探究能力得到发展,不断地积累知识,发展智慧。小学数学教学活动应该坚持以“自觉、自主、自愿”为原则,体验与感受数学活动的过程,更好地促进学生自主探究意识的培养。  一、把课堂留给学生,促使学生自觉学习  新课改提出,在教学
摘 要:本文从多元智能理论的视角,结合课程标准的要求,着重从激发情感,培养兴趣,为每个学生的全面发展,谈如何利用学生音乐等优势智能,发挥歌曲歌谣在小学英语教学中的辅助作用。  关键词:多元智能 歌曲歌谣 课程标准 兴趣 语感    1.引言    歌曲童谣是小学英语课堂教学和文化的重要组成部分,在英语教学中发挥着不可替代的辅助作用。它可营造一种愉快和谐的语言交际氛围,调动学生学习英语的兴趣和动机,
以培养学生主体意识和能力为目标,让学生积极参与学习的全过程,倡导让课堂“活”起来,让学生“动”起来的口号,更新教育观念,激发学生学习的兴趣;培养学生学习的主动性,发展学生学习的创造性,使课堂充满生机和活力,使学生在愉悦中渡过每一分钟,每一节课。    一、和谐健康的师生关系是“活”与“动”的前提    有效的教学必须以融洽的师生关系为前提,有了融洽的师生关系,学生的想象力和创造力就可能得到充分发挥