基于日常成绩的高校学生分类预测及画像构建研究

来源 :河北农业大学 | 被引量 : 0次 | 上传用户:kxl_cqmu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着教育信息化的不断发展,高校教学管理数据迅速增加。利用科学方法从中得到有价值的知识与信息,可以为高校教师教学提供更好地服务。通过学生的日常学习数据,运用数据挖掘技术对数据进行分析并建立相关模型,探索学生分类情况及其影响因素,并对学生建立课程画像,教师可以据此及时准确地掌握学生的课程学习效果,还能对课程掌握程度不同的学生群体开展差异化教学,提高教学质量。论文的主要工作如下:(1)学生数据的收集及处理。收集学生在《大学计算机基础》课程中的教学数据,采取数据预处理等方法对缺失值等异常数据进行筛选、填充,对各知识点成绩采用归一化方法统一量纲;之后根据XGBoost模型输出的各指标权重值确定影响学生分类的主要因素,为用户画像中虚拟指标的确定提供依据。(2)建立Stacking模型对高校学生进行分类预测。本研究在单分类器模型的基础上根据集成思想提出了一种基于XGBoost模型、随机森林模型及LR模型融合后的Stacking分类模型,以此模型进行学生分类情况的预测;Stacking模型在预测较差学生和预测优秀学生实验中的准确度分别达到了 85.92%和83.23%,通过与其他分类模型的对比,发现基于Stacking算法的学生分类模型比其他分类模型准确度更高,性能更好,更适合用于学生分类预测实验;最后通过2019级部分学生数据验证了该模型的准确性。(3)建立学生的课程画像。通过数据统计分析、建模分析及可视化展示等方法构建了学生的课程画像,通过基本属性、原有基础、模块掌握水平、学习投入水平4个指标来了解学生的基本信息、学习习惯、模块优劣、努力程度等,帮助教师全面的了解学生;最后通过对比验证了画像的准确性及有效性。通过本文的研究,发现基于《大学计算机基础》课程成绩的Stacking分类算法能够准确反映学生分类的结果,建立的学生画像能够帮助教师清晰地了解学生的学习特点,对今后的教学研究有着重要意义。
其他文献
国际足联举行的赛事中世界杯的收益巨大,不仅体现于国际足联的社会效益同时还有经济效益。本研究对国际足联的收入与支出进行分类分类分析,明确国际足联收入与支出的类型和具
一、教师要转变教学观念,落实新课程目标新课程改革的主要目标之一,就是要培养学生的创新精神和实践能力,但这恰恰是传统的思想政治课教学所缺乏的。传统的思想政治课教学容易
建立了弱交换半群的张量积,讨论了弱交换半群与可分半群的关系,在此基础上,进一步建立了可分半群的张量积.
日前,碧桂园租赁住房REITs一号第一期在深交所成功挂牌。该租赁住房REITs是国内首单达到100亿级规模的REITs产品,也是目前租赁住房领域规模最大的证券化产品,该产品的首期规模为
某县不动产登记机构一位负责人询问:我县人民法院出具了裁定书和协助執行通知书,要求我单位把一处房屋所有权及土地使用权进行转移登记。但该房屋因为处于抵押状态,房屋所有权证被抵押权人(一家银行)收执,该银行还持有抵押的他项权利证书。法院在执行时已经让抵押权人优先受偿,但是抵押的房屋被拍卖后,拍卖所得的全部价款仍然不足以清偿被担保的债权。因此,该银行提出:在债权全部得到清偿前,不交出原房屋所有权证,也不愿
低温严重影响水稻的地理分布、生长发育及产量。水稻在低温逆境下会产生一系列的生理及代谢变化,如:叶绿素荧光的改变,电解质渗漏增加,活性氧、丙二醛、蔗糖、脂质过氧化物、
DNA是细胞核中携带生物生长指令的遗传物质。1953年,沃森和克里克提出DNA双螺旋结构模型,推动了遗传密码的复制、转录、转译等一系列生命功能的研究,也由此揭开了分子生物学
开放环境下用户的服务请求往往与现有Web服务存在差异,要满足用户的服务请求,需要对现有Web服务重新进行组合.从Web服务组合的构件块、服务组合类型与服务组合的生命周期、服
黄河流域棉区作为我国最大的产棉区,自20世纪50年代以来,棉田面积和总产均居全国首位。常年棉花播种面积达320万hm^2,总产达210万t以上,面积和总产分别约占全国的56%和47%,是当前我