分类器在员工离职预测中的应用

来源 :广西大学 | 被引量 : 0次 | 上传用户:tx_programming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要基于数据挖掘中的决策树分类技术建立组合分类器模型,对员工离职数据集进行分类,预测员工离职。研究的主要内容包括数据预处理、单分类器模型建立以及通过剪枝、组合等手段优化模型,提高预测准确性。论文针对员工离职数据集进行数据预处理,模型建立等数据挖掘手段。数据预处理,采用数据离散化,删除数据冗余属性等方法优化数据集,之后采用有放回抽样的方法克服非均衡数据集问题。在此数据集上对比使用ID3算法、C4.5算法建立单棵决策树分类器,之后使用组合分类器bagging算法在单棵决策树的基础上构建组合分类器提高预测效率,预测员工离职,评估企业用人风险。具体来说,本文研究的内容主要有以下几个方面:(1)针对员工离职数据进行预处理。将连续数据离散化便于模型处理,填补或删除属性不全的样本,使用3种方法去除冗余属性,简化数据集。(2)处理数据非均衡问题。本文使用的数据集中正反样本比例近似为1:10,为典型非均衡数据集,采用抽样等方法将数据集处理为均衡数据集从而可以被经典模型使用。(3)建立单棵决策树模型。比较数据挖掘中2种经典的决策树分类算法,观察效率和准确率,并对决策树进行改进、剪枝和可视化操作。(4)建立组合分类器。使用bagging算法构建组合分类器方法观察准确率,使用加权投票的方式得出预测结果。通过对比实验效果,可以得知:在数据预处理阶段,删除无用和冗余的属性可以降低模型构建时间,而准确率变化不大,有效地降低了数据集的维度。在模型构造及分类预测阶段,剪枝操作可以有效简化决策树模型,而改进和组合可以提高预测的准确性。
其他文献
经济社会发展需要加强教育与产业的联系,培养更多技术型、应用型、创新型的高技能人才。文章从产教融合对经管类人才培养的意义出发,分析经管类专业应用型人才培养的现状及存
主要证明了:约化的左G-morphic的右WIN-环是π-正则环;约化的右G-morphic的左WIN-环是强π-正则环;π-正则的零因子可换环是G-morphic环;约化的强-π-正出环是Gmorphic环.
“疑欧主义”是英国对欧洲一体化政策最重要的特征。2016年6月,英国全民公投决定“脱欧”震惊世界。英国外交讲究实用主义,从“疑欧”到“脱欧”,卡梅伦政府对欧盟政策遵循的
本文主要给出了分数次极大算子在齐型空间上Herz空间中的有界性:设0〈s〈1,0〈α〈1-1/q1,1〈q1〈1/s,q^2/1=1/q1-s及0〈p1≤p2〈∞,则Ms是K^·α,p1q1(X)到K^·α,p2q2(X)的有
本文给出了一类新的广义凸函数-(F,α,ρ,θ)-b-凸函数,讨论了多目标分式规划(MFP)的三种对偶模型:Mond-Weir型对偶、Lagrange型对偶、Schaible型对偶,并基于(F,α,ρ,θ)-b-凸性证
固体火箭发动机壳体制造主要采用钢/玻璃钢复合材料,但仍没有有效可靠的方法对其进行无损检测。采用超声导波检测是较有前景的检测手段,针对钢/玻璃钢粘接复合结构中玻璃钢材
通过烯丙基溴化锌与1-苯基-2-对甲苯磺酰基乙炔的碳锌化反应及进一步与对溴甲苯的Negishi偶联反应,合成了(Z)-2-苯基-1-对甲苯基-1-对甲苯磺酰基-1,4-戊二烯.产物经^1H NMR,^13C NM
2012年1月10日,柯达状告苹果以及HTC侵犯其数码照片相关的技术专利。柯达还向美国贸易委员会发出了信函,要求阻止包括苹果的iPhone、iPad和HTC的Flyer平板电脑以及WildfireS智
为了提高多模图像配准的精度,提出了一种改进互信息的医学图像配准方法。首先求取图像的互信息,然后通过边缘算子提取图像的边缘信息,求取图像的边缘互方差;最后,将边缘互方
Ti-15V-3Cr-3Sn-3Al合金是一种在航空航天工业领域具有广泛应用前景的亚稳定β型钛合金。本文用恒应变速率法进行实验,测试Ti-15-3板材的超塑性,为超塑成形提供参考依据。