矩阵取样设计中似真值和传统能力估计方法的比较

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:shanyuqi0513
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大尺度教育评估为了扩大能力考查范围或课程覆盖面,同时缩短被试的测试时间,一般都采用矩阵取样技术作为数据收集的方式。由于评估的目的是向政府和公众报告各地区的学生学业状况,因此更加关注总体统计量:如何使总体参数的估计偏差尽可能小就成了重要的研究内容。在矩阵取样的测量情景下,传统的能力估计方法已经不能满足要求,于是研究者们提出了似真值(Plausible value,PV)的概念体系。   本研究采用模拟和实证研究考察了在不完全矩阵取样的设计中,基于IRT的PV与传统的学生能力估计方法MLE、WLE和EAP对总体平均值和标准差的估计精确性和稳健性,力求为我国的大尺度教育评估的实践提供支持。   研究一通过模拟产生了56个二分项目,考察了题目数和被试量不同的矩阵取样情况下,4种方法估计总体平均值和标准差时的精确性和稳健性。缧表明,PV对总体参数的估计最为精确和稳健;EAP倾向于低估,MLE和WLE倾向于高估,且精确性和稳健性远远不如PV,即使在总被试量最大和每个题本中的项目数最多的有利条件下仍然如此。同时,总被试量对于估计结果的影响很小,而每个题本中的项目数影响较大。   研究二采用某次大规模测试中国地区的科学数据,考察了在实际矩阵取样设计的情境下,4种估计方法在总体层面、性别层面(男/女)和地区层面(农村/城市)对学生能力的平均值和标准差的估计。结果表明,实证研究中4种方法对总体参数的估计趋势与模拟研究一致。  
其他文献
新西兰是一个多元文化一体的国家,当地土著居民毛利人占全国人口的15%,近年来新西兰加大了针对毛利成人教育的力度,在这一过程中,在尊重和利用毛利人传统价值观的基础上,毛利
随着社会的现代化发展,人们的物质生活水平水平日益提高,少数民族工艺美术作为我国传统特色文化,要想使其更好地发扬与传承,做好相关的教学实为有效途径。工作室制的教学模式
大庆油田建设集团党委大力组织开展“创建学习型组织,争做知识型职工”活动,全面提升职工队伍素质,强化了基层建设,有力地促进了企业建设的全面发展。大庆油田建设集团公司党
为检验模糊痕迹理论对错误记忆年老化机制的解释,并考察该理论所提出的刺激的情绪性特征可降低老年人错误记忆这一观点的合理性,本研究分别从理论建构与理论应用两层面对其进
2017年11月30日,在2017上海法兰克福汽配展展览会期间,同期举办的昆仑润滑油杯“中国心”2017年度十佳发动机颁奖盛典在上海扬子江万丽酒店举办.来自一汽-大众、一汽-大众奥
期刊
宽恕是解决人际冲突的有效途径,而和人际关系相关的变量也是宽恕的一个重要影响因素。本研究在同伴关系的背景下,编制了不同类型的人际伤害情境故事,探讨了关系质量对宽恕水
学位
本文通过对荣华二采区10
期刊
编辑同志: 随着我国建设事业的飞速发展和建筑节能的 深人进行,新型的供暖设施不断涌现。尼沃智能 供暖系统就是一种有代表性的低温辐射电热膜供暖系统。它不需烧煤,也不需烧气,
当前的中职教育,即使有国家一系列的政策扶持,仍面临诸多问题,教学现状不尽人意,无法满足社会经济发展的需求。根据调查分析,中职学校的教学问题集中体现在课堂教学。为了改变现状