若干标准设定方法的心理计量学比较初探

被引量 : 0次 | 上传用户:wy299
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
标准设定是当代心理与教育测量学界中被公认为相当重要、且涉及面很广、争议很大、十分棘手的一个议题,涉及到测量学家、各学科领域专家、社会公众、相关决策者等方方面面的利益。由此,关于标准设定的研究层出不穷,而对于标准设定方法的比较研究更是其中的一大热点和难点。 本论文全面阐述了标准设定的定义、历史、模型和方法、国内外关于标准设定方法的比较研究等,并运用项目反应理论对1999年6月大学英语四级考试公开卷A卷部分试题进行了分析。在此基础上提出了两大研究目的。首要目的是从不同的心理计量学方面(与外在效标的一致性程度、项目反应理论的测量精度、概化理论的评分者一致性信度)比较三种标准设定方法:Nedelsky方法、Angoff方法和聚类分析结合受试者中心模型方法的优劣。另一目的是尝试使用判别分析之判别函数获得的权重结合传统的标准设定方法辅助成套测验的标准设定。为此,抽取了1649名受试者在1999年6月大学英语四级考试A卷部分试题的得分作为样本,并选取了5位熟悉大学英语四级教学大纲以及受试者基本知识和技能水平的专家参与标准设定。得到的主要研究结果如下: 1)1999年6月大学英语四级考试公开卷A卷是由较高质量的项目构成的,采用3PL拟合数据效果较好,大多数项目都具有较好的鉴别力和中等的难度水平。因此在其基础上进行标准设定,是完全可行并具有一定说服力的。 2)三种不同的标准设定方法产生的测验分界分数之间具有一定的差异。Nedelsky方法产生的测验分界分数显著高于Angoff方法产生的测验分界分数。 3)三种标准设定方法在三个不同的心理计量学方面各具优势:在与外在效标的一致性程度方面,聚类分析结合边缘组方法最好,Angoff方法次之,Nedelsky方法最差;在项目反应理论的测量精度方面,三种方法基本相同,Nedelsky方法最好,聚类分析结合边缘组方法最差;在概化理论的评分者一致性信度方面,Nedelsky方法和Angoff方法基本相同,Nedelsky方法略高。 4)在CET-4情境下,运用Nedelsky方法和Angoff方法,14位或以上专家人数为推荐的最佳专家人数方案。 5)通过判别分析得到CET-4三部分的权重中,听力理解部分被赋予的权重最大、阅读理解部分次之、词汇与语法结构部分最小。 6)加权情境下使用标准设定方法得到的测验分界分数较没有加权情境下得到的测验分界分数在与外在效标的一致性程度和评分者一致性信度两方面都有所提高,Angoff方法较Nedelsky方法提高得尤为明显。
其他文献
本文从公共管理和制度的紧密联系入手,分析了公共管理制度和制度公共管理的概念,提出制度公共管理方式的实质就是法治方式。当现有的公共管理制度失灵时,就需要由制度创新主体进
社会适应和学业适应是童年中期儿童社会性发展的重要任务,两者的关系一直是学界关注的热点。国外大量研究表明,社会能力与学业成就相关,然而迄今为止,相关的本质并未得到充分的研
在经济全球化、区域经济一体化、信息化趋势的浪潮下,中国-东盟自由贸易区诞生了。中国-东盟自由贸易区电子商务合作是中国、东盟区域经济一体化和信息化趋势的有力结合,昭示着
目的:探讨复方“骨络”煎剂口服对膝关节骨性关节炎的治疗作用。方法:通过对膝关节骨性关节炎的膝关节处疼痛程度及临床症状、体征进行量化及采用生化方法测定患者治疗前后SOD
追溯建构主义哲学渊源和心理学基础,并从多角度认识建构主义,从而析出建构主义知识观、学习观、教学观以及建构主义数学观最本质、最核心的内核。那么建构主义作为一种学习哲学
本文在对系统评价的一般理论与方法以及模糊综合评价方法的原理、方法与步骤进行系统学习和理解的基础上,首次将模糊综合评价方法应用于监狱生活卫生管理(以下简称监狱生卫管
谷歌将与几家公司和非营利组织合作,推出一个名为OpenTitan的开源安全芯片设计项目。目前该项目大致基于谷歌在其Pixel 3和Pixel 4智能手机上使用的一种专有“信任根”芯片。
简述了湿法脱硫中的氨法脱硫和钙法脱硫的原理与流程,对比两种方法的优缺点对未来火力发电厂的脱硫前景进行浅析。
沥青混凝土路面由于其行车舒适性、便于维修等优点而被大规模应用于高等级公路。但随着国民经济的发展,交通量巨增、车辆渠道化以及超重载等接踵而来的问题使得沥青路面出现了
目的 探讨老年人适宜的健身运动强度,为老年人群科学健身提供指导。 方法 通过健康检查和调查问卷选取61~65岁健康老年男性32名(年龄62.76±2.69,BMI24.06±3.39),以健步走作