论文部分内容阅读
项目反应理论(IRT)在潜在特质理论的基础上发展起来的,与传统的经典测量理论(CTT)相比,有能力估计独立于样本、项目参数估计更为准确等优势。计算机化自适应测验(CAT)则是IRT在人工智能上的一个重要应用,它能更科学地针对被试选题,让每一个被试能够作答适合自己能力的项目,再通过如贝叶斯期望后验估计法(EAP)等算法进行能力估计。由此可见IRT在计算机的辅助下比CTT更能快更准确地估计被试能力,同时也从某种程度上减少了对人力物力上的投入。在CAT中,选题策略是一个核心部分,也是最智能的部分,因为它需要考虑的因素较多,比如测量精度及曝光率等。怎样将这些相互冲突的因素在选题策略上进行权衡(trade off)是一个值得深入研究的课题。CAT中使用的IRT模型主要分为0-1模型和多级评分模型,其中多级评分模型主要有等级反应模型(GRM)和拓广分布评分模型(GPCM)。本文的研究建立在GRM模型之上。在0-1评分的选题策略中,对于曝光率控制较好的选题策略有按a分层法、引入曝光因子的选题策略等,并且引入曝光因子的选题策略在曝光率控制均优于其他选题策略。在多级评分中应该怎样将曝光因子引入、引入曝光因子之后的效果如何、有没有对已存在的多级评分选题策略有所改进等,均是本文研究的重点。对于限制条件的平衡控制上,有按内容分层(c-STR)和Cheng Ying提出的最大优先级指标(MPI)等。随后潘奕娆对其可能存在的越界问题给与修正,提出修改后的MPI方法(MMPI)。由于MPI和MMPI方法在选择项目的过程中,容易使某些信息量大且包含限制条件数较多的项目频繁出现,于是提出将曝光因子引入MMPI方法。结果表明,引入后的方法在曝光率控制上得到了极大的改进。此外,最大优先级指标中,公式较为简洁的一阶段选题可能存在难以避免的越界情况。本文针对这一情况进行研究,分析此现象可能存在的原因,并对其修正。实验表明,在越界情况上,修正后的方法比之前的具有明显优势。此外,考虑到MPI指标中曝光率控制的不足,将修正的方案与引入曝光因子的方法相结合。结合后的方法,同时具备了计算公式简洁、曝光控制均匀、能力估计准确、限制条件不越界的优点。