基于IRT的两阶段组卷模型研究

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:jswrde
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机辅助教学的一个重要应用是计算机辅助测验。自动组卷是计算机辅助测验的重要组成部分。组卷模型的设计必须遵循科学的教育测量理论,才能保证输出的试卷具有较高质量。在对现代西方教育测量理论进行初步研究后,选择了项目反应理论(IRT)作为组卷模型设计的指导理论,提出了一种基于IRT的两阶段组卷模型,它的优势在于能够在第一阶段最大程度地满足非项目参数约束,而第二阶段则在第一阶段的基础上根据IRT对试卷进行优化,确保最终输出的试卷能达到精确测量的目的。  两阶段组卷模型是基于对组卷需求的分析而提出的。在分析组卷需求的过程中发现:测验信息量是影响模型输出试卷质量的最重要的因素,相对而言,一般性要求中的某些内容,如章节的考查比重在必要时则可以适当放松。为了避免其他约束性条件对测验信息量的干扰和影响,提出有必要将与测验信息量相关的约束性条件单独拿出来,在第二阶段专门考虑如何对其约束性进行满足。  在组卷的第1阶段,着重满足题型、题量、分值、章节比重等一般性约束条件。由于遗传算法对领域知识要求较少,收敛速度快,擅长全局寻优,且蕴含着并发搜索机制,所以将遗传算法作为求解第一阶段组卷问题的内置缺省算法。在第2阶段,在保持一般性约束不变的情况下,按IRT信息量的理论对试卷中的试题进行优化处理。优化的原理是,在保持试卷非项目参数的各项约束条件不变的情况下,利用IRT理论中的测验信息函数计算当前的信息量同测验目标信息之间的差异,并根据差异对试卷进行项目调整,优化测验信息量,直至测验信息函数的信息量分布达到组卷者的要求为止,从而保证模型输出试卷的质量。  由于不同类型的考试对目标试卷在能力区间上信息量的分布有着不同的要求,因此针对不同类型考试的试卷优化方法也不同。按照考试目的不同,教育测量学将考试划分为常模参照测验和效标参照测验。根据IRT理论分别为这两类测验设计了不同的优化算法,使得组卷模型能够根据考试类型的不同生成符合要求的最佳试卷。  通过为各类组卷算法提供统一的接口,同时为其他组卷模型提供统一的集成方案,向组卷模型提供了扩展机制,增强了其灵活性。  最后,通过设计模拟程序进行实验,将两阶段组卷模型分别应用于常模参照测验和效标参照测验,对比优化前后的组卷效果,以及同现在主流的基于离差加权的线性规划法组卷模型进行了组卷效果的对比,四个实验的对比结果显示,在根据考试类型生成最优试卷方面,两阶段组卷模型拥有绝对优势。
其他文献
自从W3C在1998年二月发布XML标准以来,XML这种数据格式以其容易掌握、结构清晰等优点得到广泛认可,并在很多商业和研究领域得到了越来越多的应用。随着XML数据的增多,人们开始考
近年来随着Internet的发展,以及社会对高等教育的需求日趋强烈,现代远程教育成为越来越被人们认识、重视和利用起来的一种新的教育模式,也促进了新的教育革命,深刻改变着教与学的
存储技术的迅速发展使得将数据对象全生命周期的状态变化纳入到数据管理的范畴越来越成为可能。数据的全生命周期管理要求掌握和理解数据的产生、转换、更新等过程,这也是数据
基于模型的软件测试是基于软件的需求分析与设计模型,提取测试信息,生成一套测试用例的技术。针对软件的不同特征和不同目的,研究人员提出过多种软件开发与测试模型。随着基于UM
伴随着互联网的发展和大数据时代的到来,网络知识库应用越来越得到用户的关注,比如智能问答系统,Google的知识图谱,百度知识图谱等,这些应用都是由强大的知识库为支撑的。然而基于
CMM和敏捷开发是软件过程改进领域两个代表性理论,分别代表着软件过程改进的“重量级”和“轻量级”思想。然而,无论是CMM还是敏捷,都尺有所短、寸有所长,不能解决软件生产领域的
随着人们对知识表示、信息组织和复用以及为用户提供有效服务的需求越来越强烈,本体作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,自提出以来就引起了国内外众
数据挖掘是当今人工智能和数据库研究方面最富活力的领域。数据挖掘是指从大量的数据中发现潜在的、有用的知识的过程。关联规则数据挖掘则是数据挖掘的一个主要研究内容。而
随着搜索引擎技术的深入发展,垂直搜索引擎在人们的个性化需求下应运而生。然而,作为垂直搜索引擎核心部分的主题蜘蛛在主题搜索方面却存在着效率不高、搜索页面信息范围受限、
普适计算(Ubiquitous Computing)创造了计算机计算的特殊阶段。这个阶段之所以特殊,是因为在信息空间与物理空间的融合中计算机自身在消亡,取而代之的是无线传感器网络。为了整