经典测量理论中信息量的衡量:基于香农熵的信息比率

被引量 : 0次 | 上传用户:refreshingmind
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
经典测量理论(Classical Test Theory,CTT)和项目反应理论(Item Response Theory,IRT)是心理测量学中的两大理论。基于经典测量理论(CTT)发展出信度、效度来衡量测验的质量。信度衡量了测验的稳定性、一致性程度。效度即测验的有效性,它衡量了测验能够测出所要测量特质的程度。但是在经典测量理论的框架下并没有发展用于测量信息量的方法。项目反应理论(IRT)从微观的角度可以对测验中项目的各类参数进行估计,并采用Fisher信息量来衡量项目信息量。在较为常用的模型中,单参数模型(1PL)、两参数模型(2PL)和三参数模型(3PL)都可以在参数估计后,基于各模型下不同的参数获得每一项目的信息量,并通过累加获得测验信息量。此外通过信度和标准误可以估算测验获得多少信息量是可以接受的。这是经典测量理论(CTT)框架下所不具备的优势。但项目反应理论(IRT)很难被普通一线教师所掌握和应用。因此,Mariam和Varazdat在2015年提出用香农熵来衡量测验的信息量,在项目难度(这里的难度采用经典测量理论的定义,下同)达到0.5时,项目达到理论上的最大信息量。但没有给出更多的具体的应用方式。而在实际考试实践中,我们对于不同的项目期望它具有不同的难度,这就首先导致实际上我们并不期望每一个项目都能达到理论最大的信息量,其次这些期望的信息没有被充分的利用起来用于评估我们的测验。此时可以根据实际需要获得一个期望信息量。而根据实际施测情况可以获得实际信息量。通过两者相比可以得到相比于期望信息量获得的实际信息百分比,衡量测试的质量,也可以对两者进行差异检验,检验测验是否严重偏离命题初衷。据此,我们可以在经典测量理论(CTT)框架下衡量信息量以及判断一次考试是否或在多少程度上实现了测验的初衷。由于经典测量理论(CTT)相较于项目反应理论(IRT)更易于理解和应用,所以即使在教师的日常教学考试活动中,也可以通过简单的计算实现应用。
其他文献
提高刊物质量首先要搞好选题─—编辑《江西社会科学》的体会郭树森编辑工作是一个系统工作,它是由选题、组稿、审稿、改稿、校对和装帧设计等几个重要环节组成的互相联系而又
本文以正式生效的CPTPP和中国正在进行谈判的RCEP为背景,研究CPTPP和RCEP的进入与否对中国以及其他国家的经济影响。本文采取全球贸易分析模型,对八种情况下各国的经济增长变
<正>一、高中生的现状分析(一)、当前高中生思想和行为特点1、价值观念取向的多元化。在价值观念取向上,多元化是当前高中学生思想和行为最明显的特点。我国现阶段实行社会主
会议
本文简要介绍了AGV在物流中的作用及发展现状,对其涉及的DSP技术、运动控制技术做出进一步描述,详细讨论了AGV传统运动控制器与基于DSP技术的新型运动控制器的结构设计,重点
试探汉平七国之战略战术余从荣西汉景帝时,各诸侯王日益骄横,渐至目无法纪。当时御史大夫晁错屡建削藩之议,诸侯王每当微罪而遭削地。①景帝三年,晁错又建议削吴,吴王濞乃联合月西
澳门由于特殊的地理位置,明代晚期就成为我国最早的对外开放地。随着欧洲对中国贸易活动的开展,茶叶成了当时中国清朝政府对外贸易的主要商品。本文主要从澳门特殊地理位置、
<正>一、辉煌的历史与严峻的现实太原化肥厂是国家第一个五年计划期间由前苏联援助的156个重点项目之一,1960年4月建成投产,经过30多年不断地扩建、改造、挖潜和开发,它已由
会议
动态路由协议在当前复杂的网络环境条件下被广泛应用,而其安全性也受到了挑战。本文分析了动态路由协议的安全漏洞、存在的安全威胁。并针对这些漏洞所可能产生的攻击提出了
锂硫电池被认为是新一代电化学储能装置。锂硫电池正极材料硫理论比容量高达1675 mAh/g。且因活性物质硫资源丰富、成本低廉、环境友好而被认为具备广阔应用前景的锂离子电池体系之一。然而活性物质硫的电绝缘性及多硫化物的“穿梭效应”等因素制约着锂硫电池大规模商业化应用。本文主要通过构建新型复合结构的正极材料和修饰改性隔膜的方式,研究其电化学性能,以期对锂硫电池正极材料所面临的问题有所改进。主要研究内容