论文部分内容阅读
综观国内外教育质量监测项目,其监测对象与内容,以及在抽样方式的选择等方面均有较大的一致性。该项目的监测目标大多关注四年级和八年级的学生;在监测内容上,大多关注阅读能力、数学能力和科学能力,或有所侧重或全部监测;不仅客观测量教育质量本身,还关注造成不同质量状况的影响因素。同时,质量监测还关注课程标准提出的三维目标,除了监测学生的知识、技能外,还关注过程、方法,并尽最大可能地实现对情感、态度、价值观的关注,以利于找到教育进一步发展的动力和教育质量不断提高的途径;在抽样方式上大多采取分阶段、分层抽样的方式进行。这些通常的做法对我们开展双语教学质量监测无疑具有较大的启发。
一、国内外基础教育质量监测基本情况
教育质量监测是发展基础教育、提升教育质量、促进教育均衡发展和学生全面发展的一项基础性工作。国外教育测评项目有国际比较项目、国家监测项目、地区监测和评价项目等不同层次、不同类型,比较有影响的项目有TIMSS、PISA、NAEP和NEMP等。
TIMSS是国际数学与科学趋势研究。它由国际教育协会(1EA)组织和实施,评价各国学生对课程的掌握情况,为各国提高数学和科学教育质量提供建议。自1995年开始,每4年测试一次,测试对象为四年级和八年级学生,主要是监测学生的数学和科学能力。
PISA是国际学生评价项目。它由国际经合组织(OECD)组织和实施,评价各国即将完成义务教育的学生面向未来生活、应对知识化社会挑战的准备情况,从而评价各国基础教育系统的产出效果。测试对象为15岁的在校学生(不论其在哪个年级),从2000年开始,每3年测试一次,主要监测学生的阅读、数学和科学能力。
NAEP是美国教育进步评价项目,也是美国国家教育质量监测项目。它从1969年开始就已经成为了一项常规性的全国教育测评项目,测试对象为四年级、八年级和十二年级学生,每4年测试一次。目前,该评价项目主要测试学生的科学能力。
NEMP是新西兰国家教育监测项目,创立于1993年,每年选择一定的学科,周期性地监测各学科的教育质量,测评的对象为四年级和八年级的学生。
TIMSS和PISA是试图比较不同国家学生在校教育期间的学业表现,并比较不同国家(或经济体)基础教育的发展情况。NAEP和NEMP的目的是提供详细的数据和信息,对本国不同区域、不同类别的学生群体的学业成绩进行纵向和横向比较,以全面了解国家教育质量的变化情况。
我国基础教育质量监测始于2007年,每年实施一次,监测年级为四年级和八年级。目前,已实施了5次,是在国家“两基”攻坚基本完成以后,国家基础教育转向内涵发展阶段,由注重规模转向注重质量,注重教育的公平发展、学生的全面发展和终身发展以及国外普遍开展教育质量监测的背景下逐步开展起来的。它是由教育部基础教育质量监测评价中心和相关省、市合作组织实施,依据国家基础教育质量监测评价工作的整体进程和安排,分年度、分领域实施全学科监测。监测内容除学生学业成绩测试外,还包括学生的德、智、体、美各个方面及其影响因素。
二、国内外基础教育质量监测的经验
教育质量监测包含抽样、监测工具研发、监测实施、数据清理、形成报告等几个主要环节。
1.抽样方案
抽样是教学质量监测中非常重要的一个环节,是从组成某个总体的所有元素的集合(N)中,按照一定的方式选择或抽取一部分元素(n)的过程,或者说是从总体中按照一定的方法选择或抽取样本的过程。抽样的最基本的作用就是给人们提供一种“由部分认识整体”的途径。国内外常见的抽样方式主要有简单随机抽样、系统抽样、分层抽样、不等概率抽样、多阶段抽样等几种。国外教育质量监测是根据不同情况分别采取不同的抽样方式。
国内外监测项目在抽样目标总体、抽样方式和总体单元的确定上大同小异,有的以学生为抽样单元,有的以某一年级学生为目标总体,有的以学校、班级为单元,等等。
PISA采用的是两阶段分层抽样方式,运用外部分层指标将总体分成不同的子总体。第一阶段的抽样单元是为所有包含15岁学生的学校,列出所有包含15岁学生的学校名称,统计每所学校15岁学生的人数,每所学校抽中的概率为这所学校15岁学生人数占国家总15岁学生人数的比例。第二阶段的抽样单元是为抽中学校的学生,列出第一阶段抽中学校的所有15岁学生的名单。其抽样的目标总体为在该国家接受教育的15岁学生,所在的年级为7年级或以上。它包含15岁接受全日制教育的学生;15岁接受非全日制教育的学生;15岁接受职业教育以及其他相关的教育系统的学生;国内接受外籍学校(国际学校)教育的学生;来自其他国家在本国接受教育的学生。它不包含不在学校上学,接受家庭教育的15岁青少年;已经参加工作的15岁青少年;在国外的15岁青少年。同时,排除因智力障碍无法完成测验的学生(需要专业判断)、因身体功能性障碍(永久性身体残疾)影响测试的学生和无法采用测试所用语言回答问题的学生。
TIMMS是采用两个阶段分层抽样。第一阶段是在全国范围内抽取学校采用的系统分层(PPS)方法,分层依据因各国具体情况而异,各层次均使用系统(随机起点,固定间隔)PPS抽样方法来抽取学校样本。第二阶段是在学校抽取的班级中采用简单随机抽样的方式进行。
我国教育部基础教育质量监测评价中心在天津市、辽宁省、浙江省等八省区开展的基础教育监测的目标总体确定为四年级和八年级学生,基本采用的是三阶段抽样设计或两阶段抽样设计。三阶段抽样设计以区县为初级抽样单元,两阶段抽样设计以学校为初级抽样单元。
2.监测内容
根据国内外的研究发现,阅读能力、数学能力和科学能力是影响学生全面发展和终生发展的主要因素。所以,目前国内外基础教育质量监测在学科的选取上大多倾向于这三个方面的能力监测。有的重点监测某一门学科或某两门学科,如TIMMS主要监测学生的数学和科学能力;NAEP主要测试学生的科学能力;PISA是对学生的阅读、数学和科学能力进行全面监测;有的采取周期循环的办法监测全学科,如NEMP每年选择一定的学科,周期性地监测各学科的教育质量。目前,在国内开展的基础教育质量监测也是采取这一办法,即每年选取一到两门学科进行监测,逐渐实现全学科监测。从监测的实施上看,有的采取综合测试,即把学生的几种能力结合在一起进行监测,如PISA,有的是按学科分别监测,对科学能力的监测基本采用综合监测的方式。 3.监测工具的研发与编制
监测工具研发是教育质量监测的核心内容,工具质量的高低,直接影响监测数据的可靠性和科学性。同时,监测工具的研发与编制也是一个非常庞大的系统工程,需要由专业教师、教育测量、命题和数据统计等各方面的专家共同组成一个多元结构的专家团队才能完成。另外,监测工具的研发、编制还是一个非常复杂的过程,它包含分析课程标准、明确测量目标和行为目标,并确定指标体系,组织命题、审题、修订试题、形成题库等较为复杂的环节。
教育质量监测的工具(纸笔测试)包括外部形式和内部构成两部分。外部形式包含指导手册、测试卷(试卷和问卷)、答题卷等;内部构成包含测量系统(测试指导、测试题、答卷)、评价系统(记分键,计分方式,常模与分数解释)、质量参数(取样构成、项目参数、信度、效度)等。
PISA的测试指标、测量工具是由参与国委员会负责确定,其开发与实施不但需要先进的教育理念引导,还需要由心理测量理论、教育评价技术、数理统计方法等专业系统支撑,并由专业考试与评价机构依据标准化的流程研发继而实施。NAEP主要是由教育考试服务中心(Educational Test-ing Service,ETS)负责题目开发、考试工具设计和数据分析报告。国内的基础教育质量监测评价项目主要是由教育部基础教育质量监测评价中心组织专家研发编制。
4.监测报告
监测报告是反映教育质量监测成果的一种书面报告,它是以文字、图表等形式将监测的过程、方法和结果表现出来,引起人们的重视和进一步思考,为有关政策的制定提供参考依据。根据监测结果形成的报告并对教育产生影响,是整个教育质量监测的终极目标。撰写监测报告的目的是了解监测的过程、方法和内容,体现监测的科学性,了解监测的结果,对现实中的重要问题提供分析的依据。
一是监测报告的主要类型有专题类报告、综合类报告和基础类报告三大类。其中,专题类报告包含专项报告、专项结果简报、咨询报告等;综合类报告包含学科报告、结果摘要报告等;基础类报告包含论证报告、技术报告、基础数据报告等。
二是各类人员对监测报告的选择。根据监测的最终目标,教育质量监测报告需要提供给不同人员。行政领导主要关注专项报告、专项结果简报、咨询报告等;专业研究人员主要关注论证报告、技术报告、基础数据报告等;校长、教师主要关注专项报告、专项结果简报、学科报告等;家长、公众主要关注专项结果简报、结果摘要报告等。
三是监测报告作为一种专业的报告,其撰写应该体现这些特点:①科学性,它要求观点正确、材料可靠,以事实为依据;②创新性,它要求关注新动向、新问题,提出新观点,形成新结论;③规范性,它要求写作规范、逻辑合理,表达简洁;③针对性,它要求目的明确、主题清晰,有的放矢;⑤时效性,它要求及时捕捉信息,及时反馈;⑥可读性,它要求语言阐述精确、通俗易懂。
根据监测的目的,针对监测结果中的某些具体问题,我们还需要进一步跟踪研究,还要继续撰写相应的专题报告。
三、我国某些地方开展双语教学质量监测的实践
下面以新疆为例,根据新疆双语教育实际,选择小学四年级和六年级双语班和普通班学生为监测目标总体,以班级为抽样单元,采取分层抽样和随机抽样相结合的方式确定样本,以汉语能力监测为突破口,逐步延伸至数学和科学能力的监测。该监测符合国际通行做法,同时也符合新疆的实际情况。
1.实施监测的背景
为大力提高新疆少数民族教育质量,培养民汉兼通少数民族人才,增强各民族青少年的国家意识和对中华民族的认同感以及各民族之间的沟通与交流,自治区党委、人民政府作出《关于大力推进“双语”教学工作的决定》,印发《关于加强少数民族学前“双语”教育的意见》,决定在新疆全面实施民汉双语教育。经过几年的努力,新疆双语教育规模迅速扩大,涵盖学前、小学、初中和高中的双语教育体系初步建立,双语教育取得了喜人的成绩。截至2010年9月,学前和中小学接受双语教育和民考汉的少数民族学生达到119.87万人,占学前和中小学少数民族学生的48%。其中,接受学前双语教育和民考汉的少数民族幼儿达到37.16万人,中小学接受双语教育和民考汉的少数民族学生达到82.71万人,占中小学少数民族学生的38.9%。
但在双语教育推进取得成绩的同时,双语教育质量问题也日益成为人们关注的焦点。大家普遍感到,当前双语教师教育教学行为、教学效果同高质量的要求还有较大差距,双语教育质量的提升同双语教育发展速度、规模还不适应,还不能满足各族群众的期盼和少数民族学生全面发展的需要。广大教育工作者迫切希望能够用较为科学的方式客观分析,把握目前双语教育质量的实际状况并着手解决当前面临的问题。
正是在这样的背景下,自治区成立了双语教学质量监测评价中心,并与教育部考试中心密切合作,共同组织实施了新疆首次覆盖7个地州,50个县市的汉语教学质量监测。测试方式采取“MHK考试 学生问卷及教师、校长问卷”的方式进行,监测对象为小学四年级、六年级双语班和少数民族普通班部分学生。此次监测旨在了解和掌握自治区小学汉语教学质量的现状和水平,分析和研究有效提高双语教育质量的途径和方法,为自治区双语教育工作科学决策、全面提高双语教育质量提供有力依据,促进全区双语教育工作积极、稳妥、有序地发展。
2.监测的组织实施
本次监测由教育部考试中心负责测试工具开发、数据清理及分析,新疆双语教学质量监测评价中心协助,完成前期抽样准备、测试安排、监测数据收集分析等工作。
根据设计方案,自治区确定了抽样方案,完成了样本数据信息的收集;相关命题专家在自治区进行了专题调研,组织开展了各地州县市监测工作人员的业务培训,做好了考场、考点、监考等相关测试工作的安排和准备;组织实施了MHK考试和学生问卷调查、教师问卷和校长问卷,并完成了数据清理和报告撰写。
3.监测的基本原则
为保证监测工作的科学性、监测结果的可靠性及监测工作长远发展的需要,根据新疆双语教育发展的实际情况和工作实际,按照国际、国内教育质量监测项目的通行做法,本次监测的实施坚持了以下几个基本原则。 一是先实验后推广。教育质量监测工作在新疆尚属首次,没有太多的经验,为保证工作的顺利进行,以及能够有效积累经验,使今后少走弯路,第一次监测只选择部分县市(7地州50个县)、小学段中的两个年级(四年级和六年级)进行抽样监测。
二是确保工作的规范性。过程的规范是保证结果可靠、科学的基础。因此,所有的抽样均采取自上而下的方式进行,即由监测评价中心根据新疆相关统计数据确定样本县、样本校及样本班;抽样方式采用通行的规范抽样方法,保证抽样结果不受人为因素干扰,保证抽样的代表性。
在组织测试过程中,为保证数据的准确性,各个环节,均严格按照监测工作相关要求进行。在试卷的印制、运送、保存到试卷的开封、发放、销毁等各个环节完全按照MHK标准进行,确保了试题的保密性。在监测考试及问卷过程中,新疆向每个地州分派了两名巡视员进行监督,各地州县市也相应地向各考点安排了1~2名巡视员。
三是对比与跟踪相结合。通过对比和跟踪可以更为全面地了解学习成效。为此,新疆选择四、六两个年级的双语班和少数民族普通班作为监测对象。一方面把双语班与普通班进行了对比,另一方面对四年级进行了跟踪监测。四年级双语班数量较多,从监测角度来看代表性较强,也比较适合做跟踪监测。六年级是小学毕业班,和MHK一级测试要求相对应,可以使用MIlK一级试卷检测其汉语学习成效。
四是保证抽样的科学性、代表性。地区、城乡之间的差异是反映全区各地不同类型双语教育全貌的。在样本地区、样本县的选择上,新疆参照国际项目的具体做法,选择南疆的喀什、阿克苏、克州、吐鲁番和北疆的伊犁、塔城和昌吉7个地区的50个县作为样本县(7个地区中只有塔什库尔干县和奎屯市因双语学生太少未纳入样本县,其他县市全部纳入抽样范围)。
在各县样本班数量的确定上,采用的是分层等比例抽样法。第一步,每个县四、六两个年级双语班和少数民族普通班均按照总班数的20%进行抽样,以确定每县每个年级抽样总数;第二步,每个县根据城区、乡村所占比例确定在每个县市城区和乡村样本班的具体数量。在样本班选择上,采用随机抽样的方式,即根据每个县已确定的城乡班级数以随机的方式确定具体班级。
通过上述规范的抽样,力求全面反映新疆双语教学的整体情况。抽样结果为,7个地州四年级共抽取样623个,学生20263名,涉及学校331所。本次监测小学四年级学生20263人,小学六年级抽取样本班597个,学生18908人,涉及学校302所。
五是从实际出发。完整的MHK应包括听力、阅读、写作和口语表达四个部分,因考虑到考点大部分在农村,难以满足口语考试对设备的需求,所以本次测试暂未进行口语表达一项的测试。
4.监测报告的撰写
根据监测的目标,该区委托教育部考试中心等部门完成监测报告的撰写,在总体报告的基础上,新疆双语教学质量监测评价中心将根据当地实际需要在总报告的基础上撰写其他分报告。同时,还将根据监测到的情况,逐步开展后续补充调研,形成更具专题性的报告。
作者单位均系新疆双语教学质量监测评价中心
(责任编辑 罗登廉)
一、国内外基础教育质量监测基本情况
教育质量监测是发展基础教育、提升教育质量、促进教育均衡发展和学生全面发展的一项基础性工作。国外教育测评项目有国际比较项目、国家监测项目、地区监测和评价项目等不同层次、不同类型,比较有影响的项目有TIMSS、PISA、NAEP和NEMP等。
TIMSS是国际数学与科学趋势研究。它由国际教育协会(1EA)组织和实施,评价各国学生对课程的掌握情况,为各国提高数学和科学教育质量提供建议。自1995年开始,每4年测试一次,测试对象为四年级和八年级学生,主要是监测学生的数学和科学能力。
PISA是国际学生评价项目。它由国际经合组织(OECD)组织和实施,评价各国即将完成义务教育的学生面向未来生活、应对知识化社会挑战的准备情况,从而评价各国基础教育系统的产出效果。测试对象为15岁的在校学生(不论其在哪个年级),从2000年开始,每3年测试一次,主要监测学生的阅读、数学和科学能力。
NAEP是美国教育进步评价项目,也是美国国家教育质量监测项目。它从1969年开始就已经成为了一项常规性的全国教育测评项目,测试对象为四年级、八年级和十二年级学生,每4年测试一次。目前,该评价项目主要测试学生的科学能力。
NEMP是新西兰国家教育监测项目,创立于1993年,每年选择一定的学科,周期性地监测各学科的教育质量,测评的对象为四年级和八年级的学生。
TIMSS和PISA是试图比较不同国家学生在校教育期间的学业表现,并比较不同国家(或经济体)基础教育的发展情况。NAEP和NEMP的目的是提供详细的数据和信息,对本国不同区域、不同类别的学生群体的学业成绩进行纵向和横向比较,以全面了解国家教育质量的变化情况。
我国基础教育质量监测始于2007年,每年实施一次,监测年级为四年级和八年级。目前,已实施了5次,是在国家“两基”攻坚基本完成以后,国家基础教育转向内涵发展阶段,由注重规模转向注重质量,注重教育的公平发展、学生的全面发展和终身发展以及国外普遍开展教育质量监测的背景下逐步开展起来的。它是由教育部基础教育质量监测评价中心和相关省、市合作组织实施,依据国家基础教育质量监测评价工作的整体进程和安排,分年度、分领域实施全学科监测。监测内容除学生学业成绩测试外,还包括学生的德、智、体、美各个方面及其影响因素。
二、国内外基础教育质量监测的经验
教育质量监测包含抽样、监测工具研发、监测实施、数据清理、形成报告等几个主要环节。
1.抽样方案
抽样是教学质量监测中非常重要的一个环节,是从组成某个总体的所有元素的集合(N)中,按照一定的方式选择或抽取一部分元素(n)的过程,或者说是从总体中按照一定的方法选择或抽取样本的过程。抽样的最基本的作用就是给人们提供一种“由部分认识整体”的途径。国内外常见的抽样方式主要有简单随机抽样、系统抽样、分层抽样、不等概率抽样、多阶段抽样等几种。国外教育质量监测是根据不同情况分别采取不同的抽样方式。
国内外监测项目在抽样目标总体、抽样方式和总体单元的确定上大同小异,有的以学生为抽样单元,有的以某一年级学生为目标总体,有的以学校、班级为单元,等等。
PISA采用的是两阶段分层抽样方式,运用外部分层指标将总体分成不同的子总体。第一阶段的抽样单元是为所有包含15岁学生的学校,列出所有包含15岁学生的学校名称,统计每所学校15岁学生的人数,每所学校抽中的概率为这所学校15岁学生人数占国家总15岁学生人数的比例。第二阶段的抽样单元是为抽中学校的学生,列出第一阶段抽中学校的所有15岁学生的名单。其抽样的目标总体为在该国家接受教育的15岁学生,所在的年级为7年级或以上。它包含15岁接受全日制教育的学生;15岁接受非全日制教育的学生;15岁接受职业教育以及其他相关的教育系统的学生;国内接受外籍学校(国际学校)教育的学生;来自其他国家在本国接受教育的学生。它不包含不在学校上学,接受家庭教育的15岁青少年;已经参加工作的15岁青少年;在国外的15岁青少年。同时,排除因智力障碍无法完成测验的学生(需要专业判断)、因身体功能性障碍(永久性身体残疾)影响测试的学生和无法采用测试所用语言回答问题的学生。
TIMMS是采用两个阶段分层抽样。第一阶段是在全国范围内抽取学校采用的系统分层(PPS)方法,分层依据因各国具体情况而异,各层次均使用系统(随机起点,固定间隔)PPS抽样方法来抽取学校样本。第二阶段是在学校抽取的班级中采用简单随机抽样的方式进行。
我国教育部基础教育质量监测评价中心在天津市、辽宁省、浙江省等八省区开展的基础教育监测的目标总体确定为四年级和八年级学生,基本采用的是三阶段抽样设计或两阶段抽样设计。三阶段抽样设计以区县为初级抽样单元,两阶段抽样设计以学校为初级抽样单元。
2.监测内容
根据国内外的研究发现,阅读能力、数学能力和科学能力是影响学生全面发展和终生发展的主要因素。所以,目前国内外基础教育质量监测在学科的选取上大多倾向于这三个方面的能力监测。有的重点监测某一门学科或某两门学科,如TIMMS主要监测学生的数学和科学能力;NAEP主要测试学生的科学能力;PISA是对学生的阅读、数学和科学能力进行全面监测;有的采取周期循环的办法监测全学科,如NEMP每年选择一定的学科,周期性地监测各学科的教育质量。目前,在国内开展的基础教育质量监测也是采取这一办法,即每年选取一到两门学科进行监测,逐渐实现全学科监测。从监测的实施上看,有的采取综合测试,即把学生的几种能力结合在一起进行监测,如PISA,有的是按学科分别监测,对科学能力的监测基本采用综合监测的方式。 3.监测工具的研发与编制
监测工具研发是教育质量监测的核心内容,工具质量的高低,直接影响监测数据的可靠性和科学性。同时,监测工具的研发与编制也是一个非常庞大的系统工程,需要由专业教师、教育测量、命题和数据统计等各方面的专家共同组成一个多元结构的专家团队才能完成。另外,监测工具的研发、编制还是一个非常复杂的过程,它包含分析课程标准、明确测量目标和行为目标,并确定指标体系,组织命题、审题、修订试题、形成题库等较为复杂的环节。
教育质量监测的工具(纸笔测试)包括外部形式和内部构成两部分。外部形式包含指导手册、测试卷(试卷和问卷)、答题卷等;内部构成包含测量系统(测试指导、测试题、答卷)、评价系统(记分键,计分方式,常模与分数解释)、质量参数(取样构成、项目参数、信度、效度)等。
PISA的测试指标、测量工具是由参与国委员会负责确定,其开发与实施不但需要先进的教育理念引导,还需要由心理测量理论、教育评价技术、数理统计方法等专业系统支撑,并由专业考试与评价机构依据标准化的流程研发继而实施。NAEP主要是由教育考试服务中心(Educational Test-ing Service,ETS)负责题目开发、考试工具设计和数据分析报告。国内的基础教育质量监测评价项目主要是由教育部基础教育质量监测评价中心组织专家研发编制。
4.监测报告
监测报告是反映教育质量监测成果的一种书面报告,它是以文字、图表等形式将监测的过程、方法和结果表现出来,引起人们的重视和进一步思考,为有关政策的制定提供参考依据。根据监测结果形成的报告并对教育产生影响,是整个教育质量监测的终极目标。撰写监测报告的目的是了解监测的过程、方法和内容,体现监测的科学性,了解监测的结果,对现实中的重要问题提供分析的依据。
一是监测报告的主要类型有专题类报告、综合类报告和基础类报告三大类。其中,专题类报告包含专项报告、专项结果简报、咨询报告等;综合类报告包含学科报告、结果摘要报告等;基础类报告包含论证报告、技术报告、基础数据报告等。
二是各类人员对监测报告的选择。根据监测的最终目标,教育质量监测报告需要提供给不同人员。行政领导主要关注专项报告、专项结果简报、咨询报告等;专业研究人员主要关注论证报告、技术报告、基础数据报告等;校长、教师主要关注专项报告、专项结果简报、学科报告等;家长、公众主要关注专项结果简报、结果摘要报告等。
三是监测报告作为一种专业的报告,其撰写应该体现这些特点:①科学性,它要求观点正确、材料可靠,以事实为依据;②创新性,它要求关注新动向、新问题,提出新观点,形成新结论;③规范性,它要求写作规范、逻辑合理,表达简洁;③针对性,它要求目的明确、主题清晰,有的放矢;⑤时效性,它要求及时捕捉信息,及时反馈;⑥可读性,它要求语言阐述精确、通俗易懂。
根据监测的目的,针对监测结果中的某些具体问题,我们还需要进一步跟踪研究,还要继续撰写相应的专题报告。
三、我国某些地方开展双语教学质量监测的实践
下面以新疆为例,根据新疆双语教育实际,选择小学四年级和六年级双语班和普通班学生为监测目标总体,以班级为抽样单元,采取分层抽样和随机抽样相结合的方式确定样本,以汉语能力监测为突破口,逐步延伸至数学和科学能力的监测。该监测符合国际通行做法,同时也符合新疆的实际情况。
1.实施监测的背景
为大力提高新疆少数民族教育质量,培养民汉兼通少数民族人才,增强各民族青少年的国家意识和对中华民族的认同感以及各民族之间的沟通与交流,自治区党委、人民政府作出《关于大力推进“双语”教学工作的决定》,印发《关于加强少数民族学前“双语”教育的意见》,决定在新疆全面实施民汉双语教育。经过几年的努力,新疆双语教育规模迅速扩大,涵盖学前、小学、初中和高中的双语教育体系初步建立,双语教育取得了喜人的成绩。截至2010年9月,学前和中小学接受双语教育和民考汉的少数民族学生达到119.87万人,占学前和中小学少数民族学生的48%。其中,接受学前双语教育和民考汉的少数民族幼儿达到37.16万人,中小学接受双语教育和民考汉的少数民族学生达到82.71万人,占中小学少数民族学生的38.9%。
但在双语教育推进取得成绩的同时,双语教育质量问题也日益成为人们关注的焦点。大家普遍感到,当前双语教师教育教学行为、教学效果同高质量的要求还有较大差距,双语教育质量的提升同双语教育发展速度、规模还不适应,还不能满足各族群众的期盼和少数民族学生全面发展的需要。广大教育工作者迫切希望能够用较为科学的方式客观分析,把握目前双语教育质量的实际状况并着手解决当前面临的问题。
正是在这样的背景下,自治区成立了双语教学质量监测评价中心,并与教育部考试中心密切合作,共同组织实施了新疆首次覆盖7个地州,50个县市的汉语教学质量监测。测试方式采取“MHK考试 学生问卷及教师、校长问卷”的方式进行,监测对象为小学四年级、六年级双语班和少数民族普通班部分学生。此次监测旨在了解和掌握自治区小学汉语教学质量的现状和水平,分析和研究有效提高双语教育质量的途径和方法,为自治区双语教育工作科学决策、全面提高双语教育质量提供有力依据,促进全区双语教育工作积极、稳妥、有序地发展。
2.监测的组织实施
本次监测由教育部考试中心负责测试工具开发、数据清理及分析,新疆双语教学质量监测评价中心协助,完成前期抽样准备、测试安排、监测数据收集分析等工作。
根据设计方案,自治区确定了抽样方案,完成了样本数据信息的收集;相关命题专家在自治区进行了专题调研,组织开展了各地州县市监测工作人员的业务培训,做好了考场、考点、监考等相关测试工作的安排和准备;组织实施了MHK考试和学生问卷调查、教师问卷和校长问卷,并完成了数据清理和报告撰写。
3.监测的基本原则
为保证监测工作的科学性、监测结果的可靠性及监测工作长远发展的需要,根据新疆双语教育发展的实际情况和工作实际,按照国际、国内教育质量监测项目的通行做法,本次监测的实施坚持了以下几个基本原则。 一是先实验后推广。教育质量监测工作在新疆尚属首次,没有太多的经验,为保证工作的顺利进行,以及能够有效积累经验,使今后少走弯路,第一次监测只选择部分县市(7地州50个县)、小学段中的两个年级(四年级和六年级)进行抽样监测。
二是确保工作的规范性。过程的规范是保证结果可靠、科学的基础。因此,所有的抽样均采取自上而下的方式进行,即由监测评价中心根据新疆相关统计数据确定样本县、样本校及样本班;抽样方式采用通行的规范抽样方法,保证抽样结果不受人为因素干扰,保证抽样的代表性。
在组织测试过程中,为保证数据的准确性,各个环节,均严格按照监测工作相关要求进行。在试卷的印制、运送、保存到试卷的开封、发放、销毁等各个环节完全按照MHK标准进行,确保了试题的保密性。在监测考试及问卷过程中,新疆向每个地州分派了两名巡视员进行监督,各地州县市也相应地向各考点安排了1~2名巡视员。
三是对比与跟踪相结合。通过对比和跟踪可以更为全面地了解学习成效。为此,新疆选择四、六两个年级的双语班和少数民族普通班作为监测对象。一方面把双语班与普通班进行了对比,另一方面对四年级进行了跟踪监测。四年级双语班数量较多,从监测角度来看代表性较强,也比较适合做跟踪监测。六年级是小学毕业班,和MHK一级测试要求相对应,可以使用MIlK一级试卷检测其汉语学习成效。
四是保证抽样的科学性、代表性。地区、城乡之间的差异是反映全区各地不同类型双语教育全貌的。在样本地区、样本县的选择上,新疆参照国际项目的具体做法,选择南疆的喀什、阿克苏、克州、吐鲁番和北疆的伊犁、塔城和昌吉7个地区的50个县作为样本县(7个地区中只有塔什库尔干县和奎屯市因双语学生太少未纳入样本县,其他县市全部纳入抽样范围)。
在各县样本班数量的确定上,采用的是分层等比例抽样法。第一步,每个县四、六两个年级双语班和少数民族普通班均按照总班数的20%进行抽样,以确定每县每个年级抽样总数;第二步,每个县根据城区、乡村所占比例确定在每个县市城区和乡村样本班的具体数量。在样本班选择上,采用随机抽样的方式,即根据每个县已确定的城乡班级数以随机的方式确定具体班级。
通过上述规范的抽样,力求全面反映新疆双语教学的整体情况。抽样结果为,7个地州四年级共抽取样623个,学生20263名,涉及学校331所。本次监测小学四年级学生20263人,小学六年级抽取样本班597个,学生18908人,涉及学校302所。
五是从实际出发。完整的MHK应包括听力、阅读、写作和口语表达四个部分,因考虑到考点大部分在农村,难以满足口语考试对设备的需求,所以本次测试暂未进行口语表达一项的测试。
4.监测报告的撰写
根据监测的目标,该区委托教育部考试中心等部门完成监测报告的撰写,在总体报告的基础上,新疆双语教学质量监测评价中心将根据当地实际需要在总报告的基础上撰写其他分报告。同时,还将根据监测到的情况,逐步开展后续补充调研,形成更具专题性的报告。
作者单位均系新疆双语教学质量监测评价中心
(责任编辑 罗登廉)