利用校本成绩评价学校基础教育质量

来源 :亚太教育 | 被引量 : 0次 | 上传用户:bonbonty
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:如果把中考、高考成绩看做是中学生学习成就的一次终极性评价,那么中学生在校期间所参加的由学校自主进行的各类阶段性测试成绩就可以被认为是中学生学习成就的过程性评价。我们可以将由学校根据本地区、本校实际情况,结合教育教学计划所进行的阶段性考核评价结果定义为校本成绩。校本成绩因其具有广泛性、时效性、针对性等特点,可以作为评价学生学习情况以及学校教学质量的重要依据。
  关键词:教学评价;校本考试;项目反应理论
  中图分类号:G420 文献标志码:A 文章编号:2095-9214(2015)02-0243-01
  基础教育是人才培养过程中最核心的环节,基础教育的质量是衡量一个地区的教育水平发展的重要指标。进入新世纪,一些重要的国际组织和政府对教育质量越来越重视,并由此发展起多种基础教育监测手段。例如,国际学生评价项目(PISA)、国际数学和科学研究(TIMSS)、美国的国家教育进步评估(NEAP)等。
  中国在《国家中长期教育改革和发展规划纲要(2010-2020)》中明确指出:把提高教育质量作为教育改革发展的核心任务,并多次强调与教育质量的监测和评价相关的内容。具体来讲,要“建立国家义务教育质量基本标准和监测制度,开展由政府、学校、社会各方面共同参与的教育质量评价活动”。进一步来说,我国要逐步形成国家、省、地市、县四级基础教育监控网络,建立起覆盖全国的教育质量监测系统。
  一、现有的评价方式存在的问题
  (1)评价对象上存在的问题
  现有的基础教育质量监测主要采取抽样的方法,选取有代表性的样本进行集中测试来评价一个地区基础教育质量情况,例如PISA采取矩阵抽样的方法在每个国家(经济体)抽取4500至10000人作为评价对象。但在实际情况中,由于各个国家、各个地区的差异,势必造成抽样的误差,无法准确反映本国、本地区基础教育质量的真实情况。
  (2)评价工具上存在的问题
  现有的基础教育质量监测所选用的工具,主要是由相关组织部门通过一定的技术手段开发的评价试题和练习经过检测后编制的试题册。由此所带来的是:评价工具试题的有限性与工具开发的高成本。首先,每一次的评价结果都是以一次评价获取的数据为依据,每次评价时的试题容量必定有限,同时,不同地区接受同一测试也有失偏颇,能否全面准确测出学生的真实情况有待考虑;其次,评价工具由专家组通过前期编制,以及后期反复检测最终编制成试题册,成本较高,对于经济发展水平低的地区难以承受。
  (3)评价的时间跨度
  现有的基础教育质量监测主要是每3到4年进行一次,如NAEP是每四年进行一次,PISA每三年一轮,因此很难针对学生的基础教育质量进行连续的监测,存在时间上的跨度。
  二、利用校本考试成绩评价的优势
  校本考试是学校根据本地区、本校实际情况,结合教育教学计划所进行的阶段性考核,例如单元检测,期中、期末考试等。校本考试考核范围广泛,涵盖学生接受的所有课程内容;其次,以单元检测为例,学生进行完某一阶段的学习内容,会及时的对该阶段的学习效果进行评价,不存在时间上的断续。因此具有广泛性、针对性、时效性等优点。
  除此之外,每个学校在学生学习期间都会有大量的阶段性考试数据,如果弃之不用将造成数据信息的极大浪费。利用校本考试数据对教学质量进行评价,不需要进行专门的抽样及试题开发,成本上几乎可以忽略不计。
  总体来说,利用校本成绩进行教学评价,具有成本低、效率高、准确性强,并与我国当前形势下的基础教育现状相适应的特点,可以预见,将具有较强的实践意义。
  三、利用校本考试成绩进行教学质量评价的方法
  由于试题的难度存在差异,比如某位考生在一次考试中获得了高分,但是下次考试难度提高后,即使其能力有所提升,但可能考试成绩也会下降,因此不能简单的通过原始分数的对比评价其学习质量,另外,由于作答时存在考生猜测等因素,使原始分数具有一定的误差。而通过一种新的测量理论——项目反应理论(IRT)的指导,可以有效解决这个问题。IRT理论即项目反应理论(Item Response Theory, IRT),是一系列心理统计学模型的总称,用来分析考试成绩或者问卷调查数据。这些模型的目标是来确定的潜在心理特征是否可以通过测试题被反应出来,具有被试特质水平不依赖于被试样本的代表性、被试能力计算不依赖于测验项目组的特点。使用项目反应理论计算出的学生能力值,不会因为测量内容的改变而发生变化,也就是说,无论测验难易程度如何,同一水平考生计算出的能力值是稳定的。
  若我们计算每次测验中考生的能力值,分析其变化趋势,即可以得出该校、该地区基础教育的发展情况,对考生的真实能力变化进行跟踪研究。例如,在连续几次测验中,学生的能力值曲线呈上升趋势,则可以认为学校近期的教学质量是有所提高的。另外,通过分析研究某一学生的能力值曲线还可以发现该生哪一部分内容没有掌握完善。值得一提的是,这种对学生能力值的计算是不需要花费太大成本的,同一估算方法经过简单修改后几乎适用于任何类型考试。
  (作者单位:江西师范大学心理学院)
  参考文献:
  [1]戴海崎,刘启辉. 锚题题型与等值估计方法对等值的影响,心理学报,2002,34(4):367-370.
  [2]罗照盛.项目反应理论基础[M].北京:北京师范大学出版社,2012,80
  [3]漆书青.现代教育与心理测量学原理[M].北京:高等教育出版社,2002,201-215
  [4]李峰,朱彬钰,辛涛. 十五年来心理测量学研究领域可视化研究——基于CITESPACE的分析[J].心理科学进展,2012,07:1128-1138.
  [5]熊江玲. 经典测量理论、概化理论及项目反映理论比较研究[J]. 求索, 2004(04)
  [6]尹秋莲,王涛. 香港高考校本评核的运用及启示[J]. 河北师范大学学报(教育科学版),2011,09:62-65.
  [7]郑晓敏,张永军. 接轨国际 多元出路 强化校本——香港高中教育评核制度改革述评[J]. 教育科学论坛,2011,05:22-24
其他文献
一、2007年广播影视工作取得显著成绩2007年,各级广播影视部门以迎接、宣传、贯彻党的十七大为主题,把握正确舆论导向,确保安全播出,依法加强管理,加快事业产业发展,各项工作在巩固
6月9日,广电总局副局长赵实会见了美国电影艺术与科学学院主席希德·甘尼斯先生一行。会见期间,赵实向客人介绍了我国电影产业各领域的发展近况,重点介绍了我国农村电影数字
2009年3月5,Blackmagic Design公司发布了用于Multibridge、DeckLink、Intensity系列视频编缉产品的Windows新驱动。Blackmagic Design7.0版本驱动加入了对Adobe Creative Su
4月15日,美国拉斯维加斯,BlackmagicDesign宣布支持以原生2K格式从索尼新型HDCAM-SRSRW-5800/2录机采集或向该录机输出。实时2K采集和回放在NAB2010SL6020号BlackmagicDesign展
目的:探讨小儿过敏性紫癜的临床特点。方法:对在我院住院的49例过敏性紫癜小儿过敏性紫癜患儿发病特点、临床表现、肾损害等进行分析。结果:农村患儿33例,占67.3%;感染34例,占69.4%;进食
中药饮片在生活中临床应用较为广泛,中药饮片在养护及储存中一些常见的实际问题,一是需要完善的硬件设施,二是对养护、储存的方法总结中药饮片的养护要点,做到理论结合实践,进行科学分析,从而对库存的常用中药饮片进行规范管理,实行科学的储存方法,在保证用药的安全性的同时优化养护及储存方法。
目的:研究氟西汀、多潘立酮、小剂量阿米替林联合用药治疗功能性消化不良(functional dyspesia,FD)的临床疗效。方法:146例符合罗马Ⅲ诊断标准并伴有焦虑,睡眠障碍的患者随机分为治
党的十八大以来,随着中国共产党党内法规制度建设进程的不断推进,党内法规制度质量也被不断关注和挖掘。作为中国共产党制度治党过程中的元问题,党内法规制度质量本身所带有
试卷讲评经常会出现这些问题,比如讲评的时间受限;讲评后学生不能订正错题,或者再碰到类似的题目还是不会;学困 生越来越害怕考试……根据学生的心理及学科特点,充分调动学生
日前,央视网在“大冬会”报道中首次成功运用Me-On-TV(我上电视)技术,成为国内第个运用该项技术报道重大事件的媒体。“大冬会”期间,央视网前方记者回传大量赛场内外视频.为后方赛