基于多层面Rasch模型的CET-SET评分员效应研究

被引量 : 1次 | 上传用户:blackhorse1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言行为测试近年来因其对交际能力和语言使用行为的考察而广受关注。口语测试作为一种典型的语言行为测试,尽管具有较高的测试效度,但由于评分受到许多因素的影响(如考生水平,题目难度,评分员效应等),容易产生偏差,影响测试信度。评分员效应是各种因素中最不可忽视的一种,因其种类多样且不稳定,极易对测试结果造成影响,因此许多研究都致力于探究评分员效应,试图寻找其规律和特性并加以控制,以降低对测试信度的影响。多层面Rasch模型(Many-Facet Rasch Model)源自心理测量学领域的项目反应理论(Item Response Theory),是原始Rasch模型的拓展,引入了更多的影响测试结果的侧面(facets),能够对各层面测量值进行独立估计,检验层面间的偏性交互作用,对主观评分质量提供系统而详细的分析。本研究对2010年11月的CET-SET某考点的考试评分结果进行了分析。通过分析发现评分员严厉度有显著差异,但总体一致性良好;评分过程中未出现明显的集中趋势,评分质量较好,考生水平得到了有效的区分和评估;评分员总体未呈现出随机效应;大多数评分员不存在显著的光环效应,但26号和12号评分员可能在评分中存在光环效应;部分评分员评分受到了考试时间推移的影响,随时间推移而产生了偏性交互作用,其中25、27、28号评分员都明显受到了时间的影响,评分准确性产生了偏差,初步推测可能是因疲劳、情绪或态度所致,但根本原因有待进一步研究。
其他文献
随着改革开放的深入发展和全球一体化的影响逐渐加大,会展市场在我国发展速度迅猛,但我国会展市场起步较晚,会展中心因缺乏经营战略规划,使得一些会展中心经营效益不佳。M国
阿瑟·密勒(Arthur Miller,1915——)是当代犹太裔美国剧作家,是美国当代最著名的现实主义剧作家。他呼吁剧作家要写赋有时代特点的悲剧,他自己也创作了一批有充实的思想内
中国特色知识产权司法体制是一个内涵非常丰富,外延相当宽泛的概念。虽然我们难以精准地定义什么是中国特色知识产权司法体制,但至少可以简单地描述概括它为一条主线、两个维
由于历史条件及生存环境的差异,中国各民族发展呈现出文化多样性与整体不平衡的状态,这种差异并不一定会成为民族之间沟通的障碍,对不同民族文化差异的理解才是影响民族交流
决策气象支持辅助系统是国外发达国家航空公司运行控制的必需系统,实践证明它对于提高运行控制能力,保证日常以及紧急情况下的飞行运行安全起到非常重要的作用。在日常运行中
自2005年以来,我国一批大型企业相继建立了财务共享服务中心,然而财务共享服务理论的研究相对滞后。移动互联网、云计算、人工智能以及大数据技术的快速发展和广泛应用一方面
基建是国民经济的基础,基建管理工作是一项综合性很强的工作,对建设单位而言,其目的就是以预定的代价取得最大的效果,或对预定的效果花费最小的代价.本文针对目前建设单位的
目的观察参芪扶正汤对中晚期宫颈癌放化疗患者免疫功能的影响。方法将89例中晚期宫颈癌患者随机分为观察组46例和对照组43例,对照组采取常规放化疗,观察组在对照组治疗基础上
本文以23mm链式炮为研究对象,首先简单介绍链式炮在国内外的发展和研究状况,再叙述了链式炮的结构和工作原理。运用经典内弹道理论和自动武器气体动力学的相关理论,建立了23m
近年来,随着我国社会经济的快速发展,部分地方政府为保GDP的高速增长,通常采用支持地方房地产行业发展的方法,即开发商得意于城市的某一地段时,地方政府就会以公共利益为名,