论文部分内容阅读
近年来,网上评卷技术已在高考这样的大型考试中得到广泛应用,为国家积累了海量完整的高考数据。与此同时,我国制定了个性化教学政策,希望提高教学质量。而基于高考数据的研究主要集中在评卷误差控制、考生隐私保护或其他方面;通过高考数据评价学生学习成果,制定个性化教学策略的研究还比较少。于是,如何挖掘、分析海量的高考数据,成为了当前的研究热点。心理学家称考试数据为测验数据,他们提出的认知诊断方法能通过测验数据诊断学生的属性掌握模式,从微观层面评价学生的学习成果。根据诊断结果,统计分析全校学生掌握每个认知属性的百分比,能从微观层面评价学校的教学质量。依据评价结果能更好地组织个性化教学,提高教学质量。测验数据可以分为0-1评分数据、多级评分数据、以及包含0-1评分数据和多级评分数据的混合评分数据。现有的基于0-1评分数据的认知诊断方法可以分为传统的参数方法和结合人工智能算法的非参数方法。参数方法借助复杂的数学模型,诊断过程繁琐;非参数方法借助智能算法,诊断过程简单。与参数方法相比,非参数方法的诊断准确率较低。为了提高诊断准确率,本文结合参数方法和非参数方法的思想,提出一种适用于0-1评分数据的认知诊断方法。考虑到认知属性在多级评分项目中的权重问题,许多适用于0-1评分数据的认知诊断方法不再适用于多级评分数据或混合评分数据。于是,研究人员将适用于0-1评分数据的认知诊断方法进行了拓展。本文也对提出的适用于0-1评分数据的认知诊断方法进行拓展,使其适用于混合评分数据。目前,有少许认知诊断方法被应用于单次的测验数据,诊断学生的属性掌握模式;鲜有认知诊断方法被用于连续多次的测验数据,评价学校的教学质量。于是,本文将适用于混合评分数据的认知诊断方法应用于某市3所中学连续5年的高考数据,从微观层面分析3所中学的教学质量5年来的变化情况。本文主要贡献如下:(1)结合Q矩阵理论、项目反应理论和K-means算法,提出一种适用于0-1评分数据的认知诊断方法(Q-I-K-means)。采用模拟研究的方法对比不同认知诊断方法在不同条件下的诊断准确率,分析Q-I-K-means的性能。其中,模拟数据考虑4种属性层级结构和4种项目滑动概率;对比方法选择3种常用的基于0-1评分数据的认知诊断方法;评价指标考虑公认的模式判准率和边际判准率。对比分析4种认知诊断方法在16种条件下的模式判准率和边际判准率,研究发现:Q-I-K-means具有更高的模式判准率和边际判准率,受属性层级结构和项目滑动概率的影响更小。(2)结合Q矩阵理论和K-means算法,提出一种适用于混合评分数据的认知诊断方法(Q-K-means)。与Q-I-K-means一样,采用模拟研究的方法对比不同认知诊断方法在不同条件下的诊断准确率,分析Q-K-means的性能。不同的是,对比方法只选择1种常用的基于混合评分数据的认知诊断方法。对比分析两种认知诊断方法在16种条件下的模式判准率和边际判准率,研究发现:Q-K-means具有更高的模式判准率和边际判准率,受属性层级结构和项目滑动概率的影响更小。(3)把Q-K-means应用到某市高考理科数学的测验数据中,以数学能力为认知属性,诊断具备不同教学质量的3所中学2013-2017年的考生的属性掌握模式;以学校为单位,统计分析每年每所中学的考生掌握每个数学能力的百分比,从微观层面评价中学的教学质量;分析3所中学的教学质量5年来的变化情况,提出个性化教学建议。本文提出的Q-I-K-means和Q-K-means都能有效提高模式判准率及边际判准率,降低属性层级结构和项目滑动概率的影响;对Q-K-means的应用能从微观角度合理评价中学教学质量连续多年的变化情况;依据评价结果能更好地组织个性化教学,提高教学质量。