基于数据挖掘的能力指标分析及毕业去向预测

来源 :大连理工大学 | 被引量 : 2次 | 上传用户:woshigezuiren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高等教育改革的深入和现实社会就业形势严峻性的凸显,毕业生对自己的能力没有一个合理的认识和估计,因此在毕业去向的选择上迟疑不决。事实上大多数高校的就业中心都会为学生的毕业去向做出指导,但是目前没有一个合适的参考标准,且主要是考虑就业形势和高等教育改革方面,没有实现个性化指导;虽然可以从综合成绩、外语水平、实践活动方面评估一个学生的能力,但是如果有一个可以直观查看学生不同能力水平的能力指标,对于学生毕业去向的选择将具有更好的参考价值。本文研究主要面向计算机科学与技术专业的学生,根据学生综合成绩、基本信息、毕业信息等数据,按照要求生成相关能力指标,并根据能力指标及某些在校行为信息使用数据挖掘技术对学生的毕业去向做分析和预测,主要从三个方面进行了实验:(1)使用k-means聚类算法,将计算机科学与技术专业的学生进行合理的聚类划分,分析学生的整体毕业去向趋势,对比每个聚类学生各项能力指标差异以及研究不同聚类的学生与毕业去向的关系。(2)使用Apriori关联规则挖掘算法,挖掘出学生能力指标与毕业去向之间的关系规则,以及学生行为信息和能力指标与毕业去向之间的关系规则,分析影响学生毕业去向的最强影响因素。(3)使用Random Forest、SVM、LR、GBDT、Neural Network五种机器学习算法,建立学生毕业去向预测模型,通过模型评估指标对结果进行比较评估,选择最合适的预测算法预测学生的毕业去向。并将各类特征因素进行重要性对比分析。从上述研究实验中,通过聚类结果分析,挖掘出了不同聚类学生对于毕业去向的不同选择,以及不同能力指标水平的学生倾向的不同毕业去向;通过关联规则挖掘算法,分析出了能力指标和在校行为信息与毕业去向的关联性;通过建立毕业去向预测模型,使用模型评估指标结果比较得出,根据能力值预测的最好模型是逻辑回归(LR),根据能力指标和相关信息预测最好模型是支持向量机(SVM),另外对各类特征因素作为单项特征进行预测,结果发现能力指标对毕业去向的影响更大,性别对毕业去向的影响最小。
其他文献
营业税改增值税是我国税法体系改革的重要一步,营改增从试点推行到在全国范围内的全面推行,也已经经历了许多个年头。企业也在积极适应营改增的过程中不断摸索着自身发展新模
研究了蚕沙和赤泥对铅镉污染土壤的理化性质和重金属形态分布的影响,并考察了蚕沙和赤泥对小白菜生长情况及吸收重金属的影响。结果表明,蚕沙能大幅提高土壤有机质含量,赤泥
桉树是我国华南地区最重要的速生用材林树种。然而,我国南方速生桉林地土壤有效磷含量低且土壤pH值大多低于4.5,活性铝含量较高。因此,桉树推广栽培过程必然面临着低磷和铝胁
目的探讨类毒素-A(ANTX-A)致神经元烟碱型乙酰胆碱受体激活和脱敏时胞内钙调信号的变化.方法用Fluo-3-AM荧光法和发色底物法分别测定PC12细胞在激活和脱敏状态胞内钙离子浓度
艾米·比奇(Amy Marcy Cheney Beach,1867-1944)是十九世纪末至二十世纪初美国具有代表性作曲家,也是美国第一个成功创作大型音乐作品的女性作曲家,并受到世界乐团高度肯定。
随着马铃薯"主粮化"以及玉米结构调整战略的提出,马铃薯在朝阳市农作物种植结构中的地位越来越重要。介绍朝阳市马铃薯产业发展及机械化应用情况,分析制约马铃薯机械化发展的
1.研究目的热休克蛋白,又称为“应激蛋白”,是当增高的热度,病原体,细胞因子,理化有害因素刺激伤害生物细胞时,激活HSP基因,编码合成的一类生物进化上最保守的蛋白。此蛋白与
《南方职业教育学刊》(双月刊)是经国家新闻出版署批准、由广东省教育厅主管、广州铁路职业技术学院和汕头职业技术学院联合主办的综合性学术期刊。国内统一刊号CN44-1679/G4
【正】随着互联网技术的飞速发展,网络用户参与信息传播的积极性被极大地激发出来,人们试图将网络互动与现实实践有机结合,并且努力开发实用且真实的应用体验。于是促成了一
在大数据时代,了解数据的分布与特征,从而发现有用的信息已经成为一个重要的研究课题,因此很多学者结合机器学习、数据库、数理统计等技术提出了数据挖掘。聚类作为一种无监督的数据挖掘手段,可以根据数据内部分布规律将数据按照相似度分成若干类。虽然已经有很多学者提出了多种聚类算法,但是随着实际数据规模的不断扩大、应用场景变得更加复杂,聚类算法仍然面对很多问题。AP(Affinity Propagation)聚