论文部分内容阅读
计算机辅助教学的一个重要应用是计算机辅助测验。自动组卷是计算机辅助测验的重要组成部分。组卷模型的设计必须遵循科学的教育测量理论,才能保证输出的试卷具有较高质量。在对现代西方教育测量理论进行初步研究后,选择了项目反应理论(IRT)作为组卷模型设计的指导理论,提出了一种基于IRT的两阶段组卷模型,它的优势在于能够在第一阶段最大程度地满足非项目参数约束,而第二阶段则在第一阶段的基础上根据IRT对试卷进行优化,确保最终输出的试卷能达到精确测量的目的。 两阶段组卷模型是基于对组卷需求的分析而提出的。在分析组卷需求的过程中发现:测验信息量是影响模型输出试卷质量的最重要的因素,相对而言,一般性要求中的某些内容,如章节的考查比重在必要时则可以适当放松。为了避免其他约束性条件对测验信息量的干扰和影响,提出有必要将与测验信息量相关的约束性条件单独拿出来,在第二阶段专门考虑如何对其约束性进行满足。 在组卷的第1阶段,着重满足题型、题量、分值、章节比重等一般性约束条件。由于遗传算法对领域知识要求较少,收敛速度快,擅长全局寻优,且蕴含着并发搜索机制,所以将遗传算法作为求解第一阶段组卷问题的内置缺省算法。在第2阶段,在保持一般性约束不变的情况下,按IRT信息量的理论对试卷中的试题进行优化处理。优化的原理是,在保持试卷非项目参数的各项约束条件不变的情况下,利用IRT理论中的测验信息函数计算当前的信息量同测验目标信息之间的差异,并根据差异对试卷进行项目调整,优化测验信息量,直至测验信息函数的信息量分布达到组卷者的要求为止,从而保证模型输出试卷的质量。 由于不同类型的考试对目标试卷在能力区间上信息量的分布有着不同的要求,因此针对不同类型考试的试卷优化方法也不同。按照考试目的不同,教育测量学将考试划分为常模参照测验和效标参照测验。根据IRT理论分别为这两类测验设计了不同的优化算法,使得组卷模型能够根据考试类型的不同生成符合要求的最佳试卷。 通过为各类组卷算法提供统一的接口,同时为其他组卷模型提供统一的集成方案,向组卷模型提供了扩展机制,增强了其灵活性。 最后,通过设计模拟程序进行实验,将两阶段组卷模型分别应用于常模参照测验和效标参照测验,对比优化前后的组卷效果,以及同现在主流的基于离差加权的线性规划法组卷模型进行了组卷效果的对比,四个实验的对比结果显示,在根据考试类型生成最优试卷方面,两阶段组卷模型拥有绝对优势。