大规模学业水平测验能力量尺的开发-以北京市义务教育阶段学业质量监测(BAEQ)为例

来源 :中国心理学会,中国教育学会 | 被引量 : 0次 | 上传用户:chinaoristand
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  学业表现水平(Performance Level Descriptors,PLD),是对各成就水平学生在内容标准方面最低掌握要求的文字说明;能力量尺(Proficiency Scale),即根据测量学基本原理与方法,将抽象化的学业表现水平进行具体化、数字化的连续性标准分数尺度。与原始分数相比,能力量尺分数具有不受测验题目内容及难度差异影响的优势,使不同测试时间的分数间具有可比性。建构学业表现水平和能力量尺是大规模学业水平测验开发的重要环节,是测验结果解释和报告的重要依据。
其他文献
随着教育和考试制度的改革,建构反应题的使用日趋频繁,由此,有关评分者效应的研究也逐渐引起热议。对于一些评分耗时较长的大型测验来说,时间因素俨然成了影响评分精确性的重要因素。本研究旨在基于前人的研究基础之上,将康春花,孙小坚和曾平飞(2016)提出的的等级反应多水平多侧面模型重新构建成可用于检测评分者漂移效应的等级反应多水平评分者漂移模型(GR-MLDM),并通过模拟研究分别对评分者固定效应和随机效
在心理与教育研究领域,问卷调查是一种重要的研究手段,在问卷调查过程中,时常会产生缺失数据.不恰当的缺失数据处理方法会降低研究的信效度和统计检验力,因此有必要采取合适的方法对这些缺失数据进行处理.Rubin根据缺失数据产生的原因不同将缺失数据分为:完全随机缺失数据(MCAR)、随机缺失数据(MAR)、非随机缺失数据(MNAR).其中随机缺失数据是某一变量数据的缺失与其它变量的取值有关.本文要研究的缺
极端化反应风格(Extreme Response Style)指被试喜欢选择比自己的实际情况更极端答案的倾向,极端反应风格的存在对被试特质估计造成偏差从而影响测验效度.国外已有研究多使用混合Rasch模型通过将被试分类从而识别存在极端反应风格的被试,并单独估计被试参数,以提高单维模型下被试特质估计精确性.Bockenholt (2012)提出在测量心理特质时被试反应过程是多重的,并以树状结构关系图
项目反应时间是一种非常有价值的信息资源,它有助于分析被试的反应速度、辨别被试的欺骗行为、改进测试设计和提高测量的精度等等。但是,长期以来反应时间都只具有理论意义,不具有实际价值。因为,在纸笔测验中精确记录每一位被试的反应时间数据是不可能的。随着计算机化测试的出现和普及,反应时间数据的记录已不再是什么难事。那么为了充分利用这部分信息为心理和教育测量服务,当务之急是建立反应时间的统计模型。
社会网络分析(下简称SNA)是对社会关系进行量化分析的技术。社会网络数据由一组行动者和行动者之间的社会关系组成,这种数据的独特性引起了越来越多的学者开始将SNA应用于心理问题的研究。但是,由于SNA的应用涉及到更多的人事物,数据的缺失是必然的现象。要使SNA方法得到更好的应用及认可,既要介绍理论及应用方法,同时还要解决方法应用中可能出现的各种问题。由于社会网络数据的相互依赖性,对缺失数据的处理不能
本研究提出一种适用于三参数逻辑斯蒂克模型(3PLM)参数估计的新方法:贝叶斯期望双重最大算法(Bayes Expectation-Expectation-Maximization,BEMM),该方法是对传统EM算法的继承和延伸。
会议
大数据时代已到来,大数据将会对社会各个领域产生深刻影响。就学业评价领域而言,教育大数据分析技术与现代教育测量统计分析技术两者在应用上有交集,也有互补性。教育大数据分析技术突破了真分数理论与项目反应理论的局限,为学业评价实践的发展,提供了更广阔的拓展空间。教育数据挖掘与学习分析技术已渗透到教育实践中,在“互联网+”的驱动下恰似“小荷才露尖尖角”,冲破现代教育测量理论的篱笆,已然对学业测量统计分析提出
长期以来伴随计算机和网络技术的发展,各行业均受到信息与通信技术(Information Communication Technology,简称ICT)的深远影响。在教育领域中,很多国家及时认识到信息技术对教育教学的积极作用,并从ICT与课程、教师培训、学校发展等不同角度的结合进行应用和探索。多个国际组织如欧盟、OECD也先后开展了对学生ICT相关素养的研究。
非学业评价是综合评价的非常重要部分,是指对没有纳入学校课程体系的对学生思想、素质、特长、能力、经历等涉及多个方面内容的评价。那么,如何这多个方面的分数进行合成,给出一个综合的评价分数,就成了一个非常关键的问题。如果仿照学业测试中分数合成的方法,即将非学业评价中各个评价方面的得分直接等权相加,会导致出现两方面的问题:一是找不到理论依据;二是无法确定合成结果的好坏。多元概化理论可以解决以上两个问题。相
初中学业水平考试全称为“初中毕业生学业水平考试”,是在新课程改革背景下,将以往的水平性的毕业考试和选拔性的高中招生考试合二为一形成的新型义务教育阶段终结性考试。学业水平考试作为一种标准参照测验,考试结果要求以等级的形式呈现,在将原始分转化为等级分的过程中,涉及到标准设定。标准设定是标准参照测验中非常重要的环节,指在测验分数分布中划出两类或者两类以上的分界分数,将考生分为“通过”和“不通过”两类,或