基于决策树和SVM的员工离职预测研究

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:zhaohuihuang8801
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
企业员工离职会给企业增加招聘成本、运营成本和经济损失,针对于此,提出利用机器学习构建员工离职预测模型。基于二叉树的CART算法和多叉树的C5.0算法有直观的分类规则,而SVM能够处理非线性特征之间的相互作用,其预测的准确度达到82%、85%和86%。但传统单棵树模型和SVM算法无法在不平衡数据场景中有效应对,对于不平衡样本,在原始数据不改变的情形下,通过增加对少类样本的学习权重,改变训练数据的权值或概率分布,有效减小了对离职员工错误分类的概率。利用SMOTE重采样算法对原始数据再平衡,在灵敏度提升的情况下,十折交叉验证平均分类准确度都在90%以上,其中,在Friedman非参数和t检验下,SMOTE-SVM模型性能最优,能够最好正确分类出离职员工和未离职员工,为企业人力资源工作和提高企业人才竞争力提供有力支撑。
其他文献
火炮身管作为管道的典型,在使用过程中,内壁要承受气体的烧伤腐蚀与弹丸的冲击和磨损,产生疵病,降低了火炮的精度和使用安全性。故火炮内膛检测尤其是深度信息检测尤为重要。常用的管道检测方法如投影法和CCD法等依赖于图像处理的精度,存在数据配准相机标定的问题,定量分析难,检测自动化程度低,轴向依赖于长推拉杆机械装置,不便检测火炮长管,存在自重造成偏心误差的问题。因此,研究出一种测量精度较高,能定量给出炮管
随着城镇化不断发展的需要,我国政府出台了一系列盘活农村宅基地相关的政策。2017年中央一号文件指出进一步盘活农村存量建设用地,允许通过村庄整理、宅基地退出等方式满足农
人类基因组计划的顺利完成,新的高效的实验技术的广泛应用,产生了海量的基因序列信息,生命科学方面的研究也正式步入了后基因组时代。蛋白质参与到生命活动的方方面面,蛋白质
近年来,随着激素替代治疗的广泛应用,关于激素替代治疗对绝经后女性心脑血管疾病的影响备受关注。研究证实激素替代治疗能够调节血脂水平,改善血脂谱,进而延缓动脉粥样硬化的发生。而氧化低密度脂蛋白是评估动脉粥样硬化发生风险的一个重要指标,目前针对激素替代治疗对绝经后女性氧化低密度脂蛋白的影响研究较少。目的:通过监测绝经后女性激素替代治疗过程中氧化低密度脂蛋白及颈动脉内中膜厚度的动态变化,探讨激素替代治疗对
学位
本论文的研究内容主要包括两个部分:格子Boltzmann方法的基本理论研究(Lattice Boltzmann Method,简称LBM);格子Boltzmann方法在致密砂岩渗流模拟中的应用——基于格子Boltzm
大量的工程实践表明,利用纤维增强复合材料(Fiber Reinforced Polymer,简称FRP)对钢筋混凝土(RC)构件进行加固能够显著提高结构或构件的承载力和耐久性。近年来,FRP加固技术
本文依托国家现代化测绘基准体系建设一期工程项目“坐标框架的稳定性分析”的需求,结合当前国际范围内普遍缺乏对区域性参考框架稳定性系统全面的评估的现状,开展了一系列关
随着科技发展的日新月异,随着AR、VR、AI、5G等越来越多前沿技术出现在我们每个普通人的生活中,这些都显示出物理与科学、技术、社会、环境的关系密不可分。了解物理学与这些方面的联系就显得尤为重要,即本文所提到的STSE。面对新时代的人才培养需求,全球教育发达地区都在强调科学技术的社会意义,物理教育必然应担起这样的责任和使命,提高每一位公民的科学素养,实现立德树人的根本任务,培养德智体美劳全面发展的
中国房地产市场日趋成熟化,房地产企业之间竞争的激烈程度比以前更加严重。在这种大环境下,如何获得可观的利润,是房地产企业面临的最主要问题。除紧跟市场动向,推出更符合消费者需求的房源外,严格控制开发成本,无疑成为房地产企业的必要选择。基于上述,本文针对房地产行业成本管理问题进行了分析论述。论述中,本文主要运用了案例分析的方法,运用成本管理理论知识对A房地产集团公司成本管理存在的问题及改进措施进行了研究