认知诊断Q矩阵修正与估计方法开发及其应用研究

来源 :江西师范大学 | 被引量 : 0次 | 上传用户:libraspace
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
认知诊断评估(Cognitive Diagnoses Assessments)可以实现对人的内部心理加工过程和认知技能的诊断,并为每个被试提供详细的诊断报告,因此在心理与教育测量领域具有重要的应用价值。认知诊断以Q矩阵(Q-matrix)为基础,结合被试在题目上的作答信息,通过认知诊断模型对被试的属性模式进行估计,因此Q矩阵在认知诊断中具有至关重要的作用。实际中,Q矩阵通常由相关领域专家进行标定,这可能会受到专家主观因素的影响,从而产生Q矩阵标定错误。并且随着认知诊断计算机化自适应测验(Cognitive Diagnosis Computerized Adaptive Testing, CD-CAT)的发展,对CD-CAT的题库建设和更新需要对大量题目的Q矩阵进行人工标定,这增加了专家的工作负担和测验开发的成本。
  根据作答数据进行Q矩阵修正和估计不仅可以减少专家标定Q矩阵时因主观因素带来的误差,还可以减轻专家的负担。查阅相关文献发现:目前国内外开发的Q矩阵修正和估计方法大都适用于约束化的认知诊断模型,而无法应用于适用面更广的饱和认知诊断模型,从而限制了这些方法在实践中的应用;已有的方法几乎都是基于0-1二级计分数据开发的,难以处理多级计分数据的Q矩阵修正和估计。为了弥补已有研究的上述不足,本文进行了以下研究。
  首先,分别从非参数化和参数化的视角,开发了可用于饱和模型的Q矩阵修正新方法。非参数化的方法结合了GNPC分类方法(Chiu,Sun&Bian,2018)和RSS方法(Chiu,2013),开发了可用于饱和模型的PLM方法(Penalty L Method)。参数化的方法从模型整体拟合的角度开发了两种适用于饱和模型的Q矩阵修正新方法—LRT(Likelihood Ratio Test)方法和BIC方法。为了提高LRT方法和BIC方法的效率,本研究提出了几种效率更高的搜索算法。通过模拟研究和实证数据分析验证新开发的Q矩阵修正方法的效果,并与已有方法(GDI方法和stepwise方法)进行比较。研究结果显示:PLM方法对Q矩阵修正的正确率整体上优于国际上已有的GDI法和Stepwise法,尤其在小样本下,PLM方法的优势更为明显;而参数化的LRT-F方法和LRT-FB方法的表现与Stepwise方法的表现基本相当,参数化方法中使用的搜索算法在修正正确率和运行效率上均优于穷尽算法。
  其次,本文将新开发的Q矩阵修正方法拓展到Q矩阵估计中,为CD-CAT题库建设和更新提供方法支持。在CD-CAT题库建设和更新中,当已知部分的题目Q矩阵和被试在题目上的作答数据,则可以将部分已知Q矩阵的题目作为基础,然后依次对新题的q向量进行估计。模拟研究考虑了测验长度和基础题个数对不同方法的影响。研究结果显示:在非参数化方法的Q矩阵估计中,PLM方法的平均AMR指标比Stepwise方法高出4%,比GDI方法高出31%。在小样本条件下,PLM方法的表现依旧稳健。在参数化方法的Q矩阵估计中,四种方法对Q矩阵估计的整体表现从高到低依次为LRT-F>BIC-F>Stepwise>GDI。
  最后,为了丰富多级计分数据下的Q矩阵修正方法,本文将新开发的参数化的LRT方法和BIC方法拓展到多级计分数据的Q矩阵修正中,并与Stepwise方法进行了比较。研究结果显示:在多级计分模型中,新开发的LRT-FB方法和BIC-FB方法修正Q矩阵具有较高的准确率,而LRT方法和BIC方法的增加属性算法的表现略低于先增加后删除属性的算法。
  综上,本文开发了几种新的Q矩阵修正及估计方法,并通过MonteCarlo模拟研究与实证数据分析相结合的方式,通过五个研究综合比较了各方法进行Q矩阵修正和估计的效果。在实际心理与教育认知诊断测验中,本文提出的方法可以对专家标定的Q矩阵进行修正,并且可以实现在已知部分题目Q矩阵的基础上自动估计其余题目的Q矩阵。以此提高心理与教育认知诊断测验Q矩阵标定的准确性,减少由于Q矩阵标定错误导致的模型参数和被试参数估计误差,还为CD-CAT题库建设和更新提供了方法支持。
其他文献
随着社会经济生活的不断发展,社会分工愈加细致,复杂商事交易活动也越来越普遍,国际商事仲裁中出现第三人的情形不断增多,一些主要国际商事仲裁机构纷纷在其仲裁规则中作出关于第三人的规定。在本文中,笔者首先界定了国际商事仲裁第三人的范围,将其区分为仲裁程序第三人、仲裁协议第三人和严格意义上的案外人。其次笔者从禁止反言理论出发,在第三人加入仲裁的现实必要性和对传统仲裁制度造成的冲击之间建立平衡,并据此对第三
研究背景随着全球老龄化进程的加快,骨质疏松带来的骨折及社会、家庭负担逐渐加重。此外,严重的创伤性骨折、肿瘤切除、先天性疾病会导致巨大的节段性骨缺损,给临床工作带来很多困难。生长因子(growthfactors)、多肽(peptides)及小分子(smallmolecules)联合人造骨移植材料(Syntheticbonegraftsubstitutes)可以明显诱导
行政补偿制度是公法上财产权保障制度中的一个重要组成部分,对于公共利益与个人利益的平衡发挥着重要作用。然而,目前我国行政补偿制度的理论研究并未受到学界的广泛重视,该领域的法制建设也处于相对滞后的局面。《宪法修正案》中的征收补偿规定对我国行政补偿制度的发展提出了要求,该领域内的统一立法势在必行。为给我国行政补偿制度的法制建设提供理论依据和学术支持,本文从以下几个方面对行政补偿制度进行了研究:第一章是引
学位
不动产预告登记制度发端于普鲁士法,完善和成熟于德国民法。它是大陆法系国家为了保证不动产登记能够反映不动产的真实权利状态而创设的保障制度。一般而言,不动产预告登记是为了保全关于不动产物权的请求权而将此权利进行的登记。其本质特征是使被登记的请求权具有物权的效力,纳入预告登记的请求权,对后来发生的与该项请求权内容相同的不动产物权的处分行为具有排他的物权效力,以至将来只发生请求权所期待的法律结果。不动产预
学位
近30年来,独立担保悄然兴起,逐步广泛应用于国际金融、国际贸易领域,但是我国现行法律法规对于独立担保还没有明确的规定,理论界也少有论述。学术上的研究以及立法上的实践远远滞后于新事物本身成长发展的脚步,独立担保应当引起我们更多的重视。本文从国际经济贸易的实践出发,考察了传统保证的局限,它已越来越不能满足国际经济交往的要求;正是在这种情况下,独立担保应运而生,它具有不同于传统从属性保证的特殊效用——独
学位
本文主体共三大部分:第一部分是电子合同的概述,在此对电子合同的概念进行了界定,并阐述了其特征。本文中的电子合同是指当事人之间通过计算机互联网以EDI、电子邮件等网络手段设立、变更、终止财产性民事权利和义务关系的协议。第二部分是对电子合同中意思表示的概述,在这一部分对意思表示形式发展的三个阶段,即口头形式、书面形式、电子形式进行了论述。其后提出了电子意思表示的概念,并分析电子意思表示的特征和类型
学位
“老龄化”和“智能化”已成为全球不可逆的趋势。由于退休、身体不便等带来的社会交往障碍,孤独成为老年人最大的情感问题。互联网时代的到来,越来越多的老年人被时代的浪潮夹裹着前进。然而,由于长期被互联网拒之门外,老年人的数字生活没有引起社会各界的广泛关注。直到微信的诞生,老年人才得以逐步踏入“数字社会”。如今,微信老年用户已成为网络用户群体中不可忽视的增量。随着互联网对人们生活的形塑和社交的渗透,越来越
学位
文化事业单位是为社会提供与文化传播有关的各类公共服务的公益性机构。文化事业工作者普遍具有专业知识和较高的文化水平,他们中多数人长年累月从事重复性高、自主性低的工作,其收入和福利待遇都比较低,职务晋升的机会也比较小。近年来,随着工作要求的提高和任务的加重,他们面临的职业压力也越来越大,而容易出现职业倦怠问题。因此,引导和帮助文化事业单位工作者正确认识职业倦怠,同时采取合理的方式缓解职业倦怠、改善心理
创伤经历是指威胁和破坏个体生理或心理安全与稳定的不良经历,这种经历可能是个体的亲身经历,也可能是一种替代经历,如目睹车祸等。创伤经历在日常生活中十分常见,小到皮肤割伤、受到批评等,但影响却持续而深刻,尤以童年期创伤经历为甚。已有研究表明,童年期的创伤经历对个体成年后的工作成就、亲密关系的建立与维持、心理健康水平等有巨大影响,甚至贯穿整个生命过程。大学生作为人才社会的中坚力量,肩负着重要使命,因此关
学位
手机给人们的生活带来了很多便利,但手机的不当使用会引发手机依赖问题,对个人的生命安全、身心健康和社会生活造成负面影响。青少年的身心发展尚未成熟,手机依赖的问题日益突出,受到人们的广泛关注。除了探讨手机依赖会对青少年造成何种影响以外,研究者们还致力于探究手机依赖的成因。在众多的原因之中,反映亲子交互作用本质的父母教养方式是一个不容忽视的重要影响因素。在以往的研究中,研究者们从变量为中心的角度出发,探
学位