CD-CAT选题策略测验精度和题库使用均匀性的关系研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:wd707800502
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
选题策略是CD-CAT中非常关键的一个环节,需要在保证效率的同时尽可能提高测量精度。这也是CD-CAT中选题策略一直以来的发展主题。国内外学者对测验精度和题库利用率的关系探讨停留在理论层面。本文从实证层面探讨测验精度和题库利用率的关系,为选择合适的选题策略提供参考,并为今后的相关研究和认知诊断计算机自适应测验的发展提供指导。为了解决上述问题,本文采用蒙特卡洛(Monte Carlo)模拟方法并以DINA模型为例展开一系列的研究,包括一个预研究和四个正式实验:预研究采用文献分析法,选取了多篇同时含有测量精度和题库使用情况等数据的论文,探讨两者之间的关系。正式研究采用模拟研究法,考察KL、SHE、PWKL、PPWKL、MPWKL、HKL、PHKL七种选题策略的题库使用均匀性和测验精度的关系,并考察不同测验长度、属性数量、被试的分布、被试数量等因素对测验精度以及题库使用均匀性的影响。本文主要结论如下:(1)MPWKL和SHE的测量精度较高,如果综合测验精度和题库的利用率,PHKL、PPWKL比较好,其次是MPWKL。(2)总体上,综合测验精度和题库的使用均匀性指标,PHKL和PPWKL处在同一水平,为第一梯队,测验精度中等,题库使用率最高,综合表现最好;HKL和PWKL处在同一水平,为第二梯队,测验精度中等,题库使用率一般;SHE和MPWKL为第三梯队,测验精度最高,题库使用率最差;KL为第四梯队,测验精度低,题库使用率一般。(3)测验长度与测验精度成正比,与题库使用均匀性成反比。测验长度为16时,各种选题策略的综合表现最好。(4)被试数量对选题策略的测验精度和题库利用率影响较小。随着被试数量的增加,选题策略的测验精度先上升,被试数量达到1000后,变化平缓,题库使用均匀性综合指标先下降,被试数量为1000后,变化平缓。被试数量为1000时综合表现最好。(5)属性个数与选题策略的测验精度成反比。属性个数越少,各选题策略综合表现越好。(6)被试知识状态分布形态为负偏态分布时,测验精度最高。被试为正态分布时,SHE、PWKL、MPWKL、PHKL等选题策略的题库使用率最高。
其他文献
硬件在环可以有效地减少电池管理系统(BMS)的开发时间,方便地对BMS进行测试,减少控制不当产生的风险。而针对BMS控制设计的电池模型需要对每一节单体电池进行模拟,这样会严重
从接地方面分析了干扰对PLC控制系统的影响和破坏,提出了一些提高PLC控制系统的可靠性和安全运行的措施,使之满足工业控制要求.
<正>目前国内社会政策学术界讨论比较多的主要有三种政策范式,即起源于欧洲的社会质量范式、以起源于美国的资产建设为典型的财税福利范式,以及源自第三世界经验的社会发展范
如果火车站售票大厅只有一个售票窗口,所有购票者全部要在这个窗口排队,那么售票大厅的卖票速度可想而知,在单位时间内卖出的车票数量将非常有限。$$此前的区块链网络处理任务的
报纸
美剧《真探》今年1月份登陆美国HBO电视台,经过两个月的播出,近日落下帷幕。作为一部年轻的剧集,其第4集在由观众打分的IMDB网站上却已达到9.9分(满分10分),另外它还将参与今年艾美
报纸
加强大学生文化素质教育是经济社会发展的需要,是中国高等教育改革的需要,是提高大学生思想品德素质的需要,是大学生全面健康发展的需要,也是深化高等学校教育教学改革的需要。因
电视传播价值归宿解决的是电视传播最终为什么主体服务的问题。以人为本把人作为世界的中心和尺度、把人的生命作为最高价值追求、把人的自由全面发展作为基本原则,符合先进文
随着中国工业化和城市化的不断推进,我国的主要矛盾已经变成人们对精神层面需求的增长超过了其生产的正常速度,于是对文化的发展提出新的要求。发展文化经济,对于创新文化发展观
船舶艉轴机械密封的摩擦副工作时,会产生大量的热量,引起密封端面温度升高,导致密封面不能正常运行。利用有限元分析软件ANSYS11.0计算不同工况下某大型艉轴机械密封环的温度场,得
采用X射线衍射分析(XRD)、差热分析(DTA)、氮吸附一脱附(Nitrogenadsorption—desorption)等方法测试超细蛇纹石粉体在物理形态、表面特征、晶体结构、热反应和相变等方面的材料特