论文部分内容阅读
随着社会的不断进步,信息技术得到了快速发展,数字化时代悄然而至[1]。计算机科学技术及互联网技术的高速发展,不断产生着海量数据,这些数据既蕴藏着无数财富,同时也不断挑战传统认知。为了能更好的挖掘其中的奥秘,找寻其中的规律,使得分析和掌握海量数据背后隐藏的无尽信息、知识和智慧成为可能,大数据技术应运而生,并且在各个方面得到了广泛应用。近年来,校园数据越来越受到高校学生管理工作人员的重视,他们希望可以通过运用机器学习及大数据技术相关理论,分析学生在校期间产生的各类数据找到学生成长规律,及时发现隐患并妥善处理,为学生制定更加科学化、人性化的管理方案,真正做到因材施教。本文试图分析高校学生在日常的学习生活中所产生的各类校园数据,为高校学生管理工作人员开展工作时,提供一定的理论支持。通过研究学生群体行为模式分析相关技术,探索如何结合使用机器学习K-means算法和NMF算法对高校学生群体的行为模式进行分类。运用基于依存关系的情感极性分类算法,研究了如何对学生网络评论进行情感极性分类,并对某高校论坛中部分真实的学生评论进行分类。最后,运用异常行为判定相关理论,对学生的异常行为进行判定,力争做到对于学生的突发状况早发现,早关注,早引导。论文除去对相关理论知识的研究与介绍,还完成了基于机器学习K-means算法和NMF算法的学生群体行为模式分析相关实验,得出了群体行为模式分类结果与特点;使用基于依存关系的网络评论情感极性分类方法对某高校论坛上的部分学生真实评论进行分类,判定出其情感倾向;运用基于SVM算法的相关理论,首先根据学生消费情况完成了经济困难生这一高校特殊群体的判定,随后结合学生相关信息对学生是否会学业重点关注作出预测并对单机与Spark平台预测效果进行了对比。