基于决策树算法和关联规则分析方法的学生就业数据分析

被引量 : 0次 | 上传用户:tonzhofpcb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提高学校的就业率与学生的就业质量,是今年来社会关注的热点内容。传统学生就业信息没有被充分利用,只是完成了简单的存储查询功能。为了挖掘利用学生就业信息,寻找其中存在的规律,从而更好的指导未来的教育教学工作,本文重点研究对学生就业信息数据的数据挖掘工作。本文主要分为五个部分。第一部分为引言部分,主要介绍了数据挖掘技术的热点内容和关键技术点,并详细了解了国内外对于此技术的研究进展情况。第二部分为算法介绍部分。主要介绍了数据挖掘现有的主要技术及算法。其中包含决策数据算法、关联规则算法和贝叶斯算法。针对决策树分析算法、关联规则算法、贝叶斯算法,通过实例阐述了各算法的实现步骤。最后对3种算法进行了详细的优缺点分析对比以及使用范围。第三部分为主要介绍了基于关联规则的决策树分析算法。算法总共包含预处理、关联规则处理、决策树分析处理和整合分析处理等几个步骤。预处理中主要完成对数据的整合、扩展、离散化等步骤,目的是将不同形式的数据整合成0与1组合的形式,方便后续算法的处理,并剔除其中异常部分。关联规则处理部分将企业属性划分成多个层次,并针对每个结果进行了关联规则分析,最终得到每个属性的强关联属性。通过决策树分析方法,构建出决策规则,从而构建起了决策树模型将学生属性与企业属性之间隐藏的关系挖掘出来,达到了数据挖掘的目的。最后通过整合,将多个属性的结果融合在一起。第四部分主要构建了学生就业信息的模型。详细介绍了数据收集和数据模型建立的过程。第五部分针对一组学生就业信息数据,通过基于关联规则的决策树分析算法进行分析,验证了算法的可靠性。最后,对全文做了总结,并对未来工作做了规划。基于关联规则的决策树分析方法能够有效的挖掘出学生就业信息数据中隐藏的信息,对指导高校的教育教学和学生的自我规划有着重要的帮助作用。该算法具有运行效率高,结果稳定等特点,对于其他类型的数据挖掘也有着积极的作用。
其他文献
在芯片设计中关键路径的延时决定了电路的主频性能,是芯片性能提升的瓶颈。通过优化关键路径提高电路性能成为当今的研究热点。一方面激烈的市场竞争和芯片规模日益复杂,对产
作为模拟世界与数字世界之间的桥梁,模数转换器(ADC)广泛应用于无线通信,生物医疗,消费电子等领域。随着CMOS工艺的不断发展,数字信号处理技术取得了长足的进步。数字校准技
以图书馆藏古文献的现状及产生的原因为例,分析了图书馆藏古文献的保护措施和方法,并提出了如何提高古文献管理人员的能力和古文献的利用。
目的:分析选择进行可摘局部义齿修复患者的个人基本情况、人格特征与其对修复效果期望值、满意度的相关性,探讨人格因素在患者修复治疗整体过程中产生的影响。方法:选择在新疆
楼梯是建筑物的竖向交通通道,也是地震时人民群众疏散的唯一途径,但是近几年的震害调查发现,在地震中楼梯发生了各种形式的破坏,包括梯段板的折断,平台板、平台梁的破坏,楼梯间角柱
本文首先揭示了薪酬管理在整个人力资源管理系统中的重要作用;其次介绍了有关薪酬管理的基本概念,并将从早期工厂制度时期到现代薪酬管理划分为四个阶段,分别描述、分析各个
琥珀酰化改性菜籽蛋白(SRPI)与羟丙基甲基纤维素(HPMC)复合制得薄膜。通过对复合膜机械性能、水蒸气透过性、透明度、二级结构和微观结构进行表征。结果表明:菜籽蛋白(RPI)经
目的:运用缓慢捻进针法治疗肝郁脾虚型不寐,以西药口服为对照组,根据不寐的临床疗效标准、匹兹堡睡眠质量指数(PSQI)以及肝郁脾虚型不寐主要症状评分表来进行疗效评价,探讨该
基于人口与城镇化视角,构建了中国碳排放七大驱动因素模型,并采用LMDI分解法计算出各因素的影响效果。研究发现:(1)从变量作用方向来看,对碳排放一直保持正向促进作用的有人
水是人类生存、生活和生产所需的最重要的物质之一。面对当前严峻的水污染形势,发展绿色高效的水处理技术势在必行。针对水体中种类繁多的污染物质,多种多样的水处理工艺应运