论文部分内容阅读
数字教育资源开放共享的优势使它能够快速响应不同层面学习者的需求,其有效应用也是解决教育公平的重要手段。但受部分教师自身能力的限制,在利用现有资源开展教学方面并未取得于预期成效。因此探索如何实现数字资源应用能力有效监测成为教师能力提升工程及解决教育应用差异的重要一环。然而传统的问卷测评难以覆盖到每一教师个体,常用的线性回归模型往往是对一个群体的研究和评估,不能满足和支撑粒度更细的教师个体研究。但随着计算机软硬件的迅猛发展,计算机算力已不再是实验的限制条件,本论文使用机器学习相关算法,来解决线性回归模型拟合样本能力过弱的缺陷,并实现研究主体从群体到个人的转变,以达到利用智能化测评优化培训方案推助教师成长。基于上述背景,本文以教师数字教育资源应用能力精准预测为目的,利用机器学习算法,实现了对教师数字教育资源应用能力的因素分析,并依据分析结果进行特征工程,随后构建模型对应用状态进行预判,本论文主要工作如下:(1)教师数字教育资源应用能力影响因素分析。在对数据进行预处理后,对教师及学校两个层面的背景变量和培训变量以及其中交互的关系做出假设,利用多层线性回归进行验证,得到教师的学历、教学年限等1 1个指标对数字教育资源应用能力有显著影响,且两个层面指标间具有交互效应,也为进一步预测指标提供筛选。(2)构建基于多层线性回归、随机森林、XGBoost、LightGBM的预测模型。通过实验,各个模型在平均绝对百分比误差指标分别为15.22%、3.96%、4.02%、5.13%,验证了在教育领域的预测任务中机器学习中的回归算法优于传统的线性回归预测算法。由于随机森林与XGBoost、LightGBM的结构差异较大,所以本论文将这三个模型再次融合并进行实验,对比寻优发现基于随机森林的多层组合模型是预测的最佳选择,平均绝对百分比误差指标在融合后的模型得分最好为3.68%,优于随机森林的3.96%。(3)教师数字教育资源应用能力预测结果应用。在区域层面展示如何基于预测值进行宏观的监测以及培训需求的精准化识别,从而支持管理部门在培训次数确定、参训人员选择、培训规模组织等方面决策。在教师个人层面提供分值排名及各培训维度指标画像,辅助教师自我认知,同时方便学校开展差异化管理。