基于逻辑回归模型的员工离职问题研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:zhu_2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人才是一个企业蓬勃发展的关键力量,人才流失会导致企业竞争力的降低,进而影响企业的发展。许多企业面临着员工主动离职引起的人才流失问题,而如何解决这一问题成为企业人力资源管理者的难题。通过统计分析和机器学习方法找到影响员工离职的关键特征和建立员工离职预测模型,可以帮助人力资源管理者对员工离职的原因进行分析以及提前找到有离职倾向的员工,进而采取相应的措施来降低企业员工的离职风险。以IBM Watson Analytics平台提供的企业员工离职数据为研究对象,针对数据集中存在的员工离职比例高的问题,在寻找影响员工离职的关键因素上,对数据进行说明、清洗后,利用逻辑回归模型对影响员工离职的特征重要性进行分析。首先利用描述性统计方法对公司员工在各个特征上的分布情况进行分析,从整体上对员工的分布情况进行初步的了解。接着对特征和离职状态的相关性进行分析,剔除与离职状态不存在线性相关的特征。之后对数据进行预处理,进行特征选择以及对无序分类特征进行独热编码。在进行了相关参数设置后,利用10折交叉验证训练模型,得到准确率为74%,精确率为36%,召回率为73%,AUC值为0.80的逻辑回归模型,以及由模型得到的与员工离职呈正相关和负相关的各个特征排序。选择对员工离职影响最大的三个正相关的特征,频繁出差、加班、未婚,结合员工的年龄和月收入状况对五个较高离职比例的职位销售代表、实验室技术员、人事、销售人员、研究员进行离职原因分析并给出相应建议。在企业员工离职预测模型的构建上,为了避免对不平衡数据进行处理导致的模型过拟合问题,将Bagging算法和欠采样方法相结合来对离职数据集中的不平衡数据进行处理,建立企业员工离职预测模型。通过因子分析和WOE编码来对特征进行处理,利用Bagging算法和欠采样方法构建平衡数据子集,选择逻辑回归作为基分类器,进行相应的参数设置后进行训练。训练基分类器时进行5折交叉验证,最后得到了准确率为76%,精确率为41%,召回率为81%,AUC值为0.85的员工离职预测模型,并且在召回率和AUC值上,均高于改进前的逻辑回归模型以及随机森林模型和梯度提升树模型,说明模型具有较好的预测性能。结果表明,利用逻辑回归模型可以得到与员工离职呈正相关和负相关的各个特征的重要性排序,与Bagging算法和欠采样方法相结合后可以建立避免过拟合且有较好预测性能的员工离职预测模型,能够帮助企业的人力资源管理者分析员工离职的原因,提前找到有离职倾向的员工,对解决企业中的员工离职问题有一定的参考价值。
其他文献
妊娠期阿片类药物使用已成为全球严重的公共卫生问题,妊娠期吗啡暴露可影响胎儿大脑发育。急性吗啡依赖大鼠模型可模拟人类的成瘾过程,因此可以利用胚胎期吗啡暴露大鼠来模拟妊娠期阿片类药物使用。本实验通过建立SD大鼠胚胎期吗啡暴露模型,通过行为学、分子生物学研究观察胚胎期吗啡暴露子代的行为、认知改变以及海马、前额叶皮层、伏隔核和腹侧被盖区等成瘾关键脑区的相关分子表达。本实验中发现:(1)行为学:水迷宫实验中
应激是日常生活不可避免的事件,其特征标志是糖皮质激素升高。糖皮质激素作为HPA轴终端肾上腺皮质分秘的终端激素,功能十分广泛,其分泌异常和多种精神疾病密切相关。以往研究提示运动对糖皮质激素的释放有明显的调控作用,但我们尚不清楚是运动的计划阶段、运动的执行阶段还是运动对机体的影响调控了糖皮质激素的释放,相关神经通路尚不明确。内侧苍白球(GPi)作为基底神经节的输出核团,在运动的准备及维持中起着非常重要
研究表明甲酰化肽受体FPR2在肝癌、胃癌等多种癌症中起到抑癌作用,但在肺癌中的作用机制尚不明确,我们通过前期对肺癌组织、癌旁组织和正常肺组织的测序分析中发现:FPR2在肺癌组织中的表达低于癌旁组织和正常肺组织,在FPR2低表达时SNHG16的表达升高,同时伴随着在多种癌症中起到抑癌作用的mi R-660-5P以及肺癌候选治疗靶标β-连环蛋白的相关变化。本研究主要探究了FPR2以及其下游分子SNHG
目前砷污染环境问题已经在全球范围内受到高度关注。虽然经过前人的努力与奋斗,已经在砷污染的治理上取得了较为突出的效果,但是全球的环境形势依然严峻。因此,选择高效的除砷技术已刻不容缓。本论文选用的除砷技术为吸附法。本论文以微孔ZSM-5为原材料,采用碱熔-水热法,通过合理的调控体系的相关参数,得到扩孔的ZSM-5K。研究结果表明,最佳的扩孔条件是:ZSM-5与碱的质量比为10:1,水热时p H值调节为
目的:羟基红花黄色素A(HYSA)是从红花中提取分离的活性成份,具有活血化瘀等多种功效。本课题既往研究发现羟基红花黄色素A处理可以抑制固有免疫的激活,改善同系小鼠皮片离体保存后的移植成活质量,基于课题组既往研究,本论文探究羟基红花黄色素A在同系小鼠皮肤移植中抑制固有免疫系统的机理。方法:体外研究:在体外培养Balb/c(H-2d)小鼠朗格罕氏细胞(LC)和脾细胞。将实验分成两部分,3组,A组:Ba
建筑遗产是人类历史的实物遗存,它承载了人类悠久的文化,见证了社会文明的发展进程。作为一种不可再生的、不可替代的历史文化资源,建筑遗产具有深厚的历史文化价值。在旅游迅猛发展的同时,建筑遗产的保护与发展显现出一系列的问题与矛盾。由于我国建筑遗产旅游起步较晚,导致许多管理者并未真正理解建筑遗产旅游的目的与意义,只是以发展旅游、增加旅游收入为目的而盲目消耗遗产资源。这种掠夺式的建筑遗产旅游开发并不利于建筑
戊型肝炎病毒(Hepatitis E virus,HEV)是一种严重危害人类健康的病毒性肝炎病原体,其发病率居人急性病毒性肝炎之首。戊型肝炎早期一直被认为是一种急性自限性疾病,感染者排毒3~4周后可自行康复。随着戊肝研究的深入,关于戊肝病毒持续性感染的临床报道日渐增多。但是HEV持续性感染的致病机制尚不清楚。本文旨在从宿主免疫抑制和病毒突变两个方面,在动物和细胞两个水平,建立HEV持续性感染动物模
超滤技术具有使用压力低、分离系数大、出水量大、设备简单等特点,其在环境水体净化技术中具有重要的意义。但是,超滤过程中由于超滤膜的膜表面化学、膜-溶质和溶质-溶质相互作用造成的膜污染,严重影响着超滤技术的发展。目前,还没有有效的方法来彻底解决超滤膜污染问题。研究以亲水性改性为基础,辅以高压直流电场极化处理,利用改性无机纳米颗粒掺杂PVDF制备了Nano-Si O2/PVDF超滤膜、Nano-Si O
目的肝脏解剖结构复杂,包含多套血管系统,使得肝脏手术难度高、风险大,传统的医学影像资料并不能满足精准肝脏外科对血管三维空间数据的要求。利用3D打印技术的三维重建对患者肝内重要血管进行重建,能精确、直观展示肝脏血管三维分布情况,指导精准肝脏手术,提高手术安全性,降低围手术期的死亡率。小肝癌作为能够被早期发现与诊断,手术切除之后有较好预后的一种肝细胞肝癌,其发病位置极其不定,借助3D打印模型引导该种肝
对羟基苯甲酸丁酯(BP)被广泛用于工业防腐方面,它在环境中普遍存在,具有雌激素效应、能够诱导细胞毒性。目前BP的去除研究涉及到电化学、过氧化和光化学等。其中光化学与过氧化过程结合的高级氧化技术是BP在水环境中降解的重要途径。光与过氧化物的结合兼具高效和经济等优点。溶解性有机质(DOM)在水体中普遍存在,是较为重要的环境因素之一。DOM作为环境因素抑制光/过氧化过程中有机污染物的降解也有研究人员进行