多级评分相关论文
在等级反应模型(GRM)下成倍增加多级评分试题的分数等级,项目信息量只是小幅度地增加,而不是成倍地增加。从能力估计的角度分析,当难度b......
多分属性认知诊断模型(CDMs)比传统的二分属性CDMs提供更详细的诊断反馈信息,但现有大部分多分属性CDMs并不具备直接分析多级(或混......
当今,传统测验越来越不能满足社会的需求,因为它只能提供给被试一个笼统的分数或能力,对于考生具体的知识状态无法获知。与传统测验相......
计算机化自适应测验(Computerized Adaptive Test,CAT)是基于项目反应理论(Item Response Theory,IRT),并由计算机根据被试能力水......
计算机自适应测验(CAT)选题在实际应用中不仅需要考虑统计优化问题而且需要满足非统计约束。统计优化指测验要保证有较高的测量精......
学位
本文基于DINO模型开发出一种分离型的多级评分认知诊断模型(P-DINO模型),并采用Monte Carlo模拟与实证研究相结合的范式,探讨了新模型......
选题策略是计算机化自适应测验的研究重点.最大Fisher信息量(MFI)选题策略可以综合项目参数和能力参数,测量精度高,但是曝光率不......
在给定被试在项目上得分的概率分布列后,把最优评分权通式代入测验信息函数和分数信息函数进行验证,得到:当采取评分权对项目进行评......
本文对多维特质、多级评分的项目反应理论之全息项目因素分析进行了探讨。文章认为,全息项目因素分析的特点是使用了类别反应的全部......
如何通过测验了解学生的知识掌握程度,测验项目编制是否合理是教育工作者非常重要的研究课题.认知诊断理论可以说为此课题的研究打......
测验等值是教育学、心理学中的一项重要研究内容,它对于考试的公平性、可比性、题库建设、教育质量评价、计算机自适应性测验都有......
传统教育测验只简单给出测验分数,其目的也只是为了排名选拔或者评定整体水平,而不考虑被试潜在的心理过程、认知特点。不同于传统......
在某种给定的评分方式下,假设属性之间没有补偿作用,讨论多级评分认知诊断测验蓝图设计问题.根据图论,将J.P.Leighton等定义的线型、发散......
针对目前的多数认知诊断模型不能适用于多级评分的问题,文中基于GP-DINA模型,通过引入潜变量与滑动参数,提出一种面向学生的多级评......
基于等级反应模型的属性层级方法和多级评分的广义距离法,是两种基于项目反应理论的多级评分的认知诊断方法。本文通过采用Monte C......
对Q矩阵理论及其改进、拓展进行了简略的回顾。给出基本矩阵的概念,针对两个属性之间存在多条路径的这种层级结构,提出将基本矩阵作......
认知诊断因其能识别被试认知状态已成为CAT研究的重要部分之一,但目前研究大多都基于0-1评分,这与我国试题也采用多级评分现状不相......
定义了属性之间菱形层级结构的概念。在某种给定的评分方式下,假设属性之间没有补偿作用,讨论独立型、菱形层级结构对应的多级评分认......
多级评分可以提供更多的认知诊断信息,在对多级评分多策略实测数据进行分析的基础上提出多策略的多级评分认知诊断方法.考虑到被试......
以"进位计数制"为测验内容,运用基于多级评分的广义距离法(简记为GDD-P)进行认知诊断,得到被试的属性掌握模式,这不仅验证了可以对多级......
精确诊断学生的知识状态是开展个性化教学的基础和前提。然而,目前RSM的0-1评分方法无法对学生的知识掌握程度做出精确评价。为解......
医学资料一致性的统计处理方法(二)张生平三、综合Kappa(K综合)对于两种处理,且产生的结果不是两类而是多类,一般Kappa就不适用了。我们把一般Kappa进行扩......
对多级评分的测验题型,给出了其Bayes模型,在无信息先验分布或先验分布是Dirichlet分布情形下求出了参数的Bayes估计,并对后者在不......
计算机化自适应测验是现代测验研究中的一个重要领域,而目前大多研究都基于0-1评分模型,适用范围不广。本文对Samejima等级反应模......
运用多策略的多级评分认知诊断方法对被试就"进位计数制"这一内容的掌握情况进行诊断,得到每个被试的属性掌握模式,提供了一种多策略......
认知诊断是近些年教育测量研究中的热点,大多数的认知诊断模型仅适用于0~1评分的情况.本文提出一种有多个潜变量多个滑动参数的多级......
作为新一代测验理论的核心,认知诊断(cognitive diagnosis,CD)主要应用于教育与心理测量领域,它能实现对个体内部心理加工过程的测......
对多级评分的测验题型,给出了其Bayes模型,把先验分布从无信息先验推广到了更一般的Dirichlet先验分布情形,求出了参数的Bayes估计......
本文在0-1评分的CD-CAT基础上,拓展出了适合多级评分CD-CAT(ps CD-CAT)的认知诊断模型及选题策略,为实现多级评分CD-CAT提供了方法支......
近年来,随着计算机网络技术的发展,逐渐出现了许多基于项目反应理论(IRT)的自适应系统,克服了经典测量理论(CTT)老套的出题方式和......
考试制度的创设虽然源自中国,绵延数千年后,世界各国争相采用,以作为建立文官制度的选拔依据,但是中国却一直没有针对考试进行比较......
首先阐述了等级反应模型(Graded Response Model,简称GRM)的原理和算法及其在多级评分中的应用,接着对等级反应模型(GRM)的参数估......
基于属性合分和聚类分析的思想提出了适用于多级评分的聚类分析方法,同时探讨了属性层次结构、样本容量和失误率对该方法判准率的......
通常0-1项目的认知诊断模型中均假设回答各个项目是相互独立的,但一些实际测试中该假设可能不满足,比如2个项目的背景材料相同,后......
多级评分比2级评分能提供更全面更丰富的诊断信息,更好地反映被试对知识的掌握状况.考虑到存在不同认知诊断策略对应不同属性层级......
大学英语的教学效果涉及全国几百万学子的外语能力,其意义直接影响着我国经济和社会的发展.作为一种经典的能力测验评分手段,项目......
DINA(deterministic input, noisy, and gate)模型作为一种简单的认知诊断模型,具有估计参数少、数学表达式简单和易于理解等各方......
在2种传统的BCAT测验设计的基础上,提出了4种新的BCAT测验设计,并采用国际上通用的Monte Carlo模拟实验的方式,从被试能力参数估计......
随着互联网技术的发展,近年来将教育与“互联网+”技术结合的研究与产品愈发层出不穷(张华华,汪文义,2016)。认知诊断计算机自适应......