基于机器学习的网络招聘薪资影响因素研究

来源 :长江大学 | 被引量 : 0次 | 上传用户:suishi2001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济结构的优化调整与信息化时代的到来,如今网络招聘越来越流行,网上的招聘信息也越来越多,而薪资情况是每个求职者最为关心的事情之一,所以对影响薪资因素的研究,能够为求职者提供相关参考,使得求职者能从海量的招聘信息中获取就业需求信息。本文利用python语言编写爬虫程序获取智联招聘中的数据分析、机器学习、数据挖掘、深度学习的岗位数据,建立薪资水平的预测模型,分析在这些岗位数据中影响薪资水平的因素。本论文主要从XGBoost模型和GBDT模型这两个方面对薪资预测模型进行了研究,主要工作内容如下:(1)采用深度优先和宽度优先的两种爬虫策略,通过多进程爬取招聘信息中的岗位数据。通过掌握XGBoost模型和GBDT模型的算法过程,为模型的研究建立理论基础。(2)本文获取的招聘数据中存在大量的结构化和非结构化的文本数据,对结构化数据采用探索性分析及可视化技术,分析各个变量与薪资之间的影响关系。对非结构化变量中的文本数据采用了文本处理技术及可视化技术,使用这两个技术对文本数据中的信息进行可视化处理以及利用可视化中的词云图提取岗位招聘数据中的技能信息。通过对结构化数据的分析及非结构化数据的技能信息的提取,然后采用独热编码技术将离散型的分类特征转化为二进制的向量表示,将这些经过独热编码了的数据与数值型的薪资数据进行组合,构建模型所需的数据特征。为模型的预测和薪资的影响因素分析做铺垫。(3)采用XGBoost模型和GBDT模型对薪资的影响因素进行分析。根据探索性分析了解到影响薪资因素的变量特征。使用机器学习算法中的GBDT和XGBoost算法模型进行参数调优并得出最优参数,通过调优选择的参数进行薪资的模型预测并对变量特征进行重要性评分以及对影响薪资的因素进行排序,通过排序得出主要的影响因素。最后利用训练集准确率、测试集准确率和RMSE评估指标,对模型的预测效果进行对比分析。结果表明:XGBoost模型要优于GBDT模型,所以XGBoost模型更适合薪资影响因素的分析。
其他文献
空肠弯曲杆菌是一种广泛存在于食品和环境之中,对人类健康以及食品安全领域带来的危害极为严重的常见肠道致病菌。空肠弯曲杆菌感染会引起人肠道的炎症反应,严重时会使人罹患
【摘要】将生本理念融入到初中数学教学之中,充分尊重学生的学习主体性,给学生更多的将理论和实践学习相结合的机会,让学生产生更加丰富而深刻的数学学习体验。教师围绕着生本理念组织学生们通过小组合作自主探究等方式学习数学这样的学科内容,提高学生们的学习主动性,提高学生们的学习成效感。  【关键词】初中数学教学生本理念学习主动性  初中数学教学中引入以生为本的理念组织教学,重点强调学生作为整个教学活动的中心
以RCS9700变电站监控系统为例,对目前变电站监控系统使用较多的SQL Server数据库中数据剧增的3种现象进行分析,探究原因,并给出详细处理办法。
每一种新媒介都是一种新文明的标尺,媒介发展过程也是人类文明的发展过程。媒介与文化关系密切,不同的媒介形态对文化的传播方式和话语体系有其深刻的影响。从报纸、电视到PC
本文介绍了高品位赤泥冷固压球后在炼钢、炼铁过程及赤泥还原铁在炼钢过程的应用实践,拓展了赤泥的应用的领域。
2020年初暴发的新冠肺炎疫情,对人民的生命安全、经济社会的正常运转带来了严重的威胁,迅速引发了广泛的舆论关注。由疫情公共危机引爆的社会舆情在信息大数据的背景下有了全
机械设备的零件存在质量问题,就必然会影响机械设备的运行质量。机械加工企业要提高零件的质量,需要重点关注机械加工零件表面纹理缺陷的问题。对机械加工零件表面所存在的纹理缺陷进行检测,并有针对性地提出技术解决措施,以解决零件不合格的问题。
期刊
【摘要】影响小学生数学问题解决的因素主要有知识基础与经验薄弱、思维定式以及问题解决情境的创设等。基于此,提升提高问题解决能力的途径主要有:创设良好的问题情境,培养良好的思维习惯;改善教师教学方式,教授多样化的问题解决策略;构建有效的课堂,改善小学生问题解决能力培养的环境。  【关键词】小学数学 问题解决能力 策略  一、小学生数学问题解决能力的影响因素  (一)小学生知识基础与经验薄弱的影响  一
随着互联网的快速发展,互联网广告行业中的数据造假等失范行为屡屡发生。为了使虚假数据更具"真实感",数据造假技术也日新月异,从最初人工刷量发展到机器人刷量,如今更是将各