基于机器学习的学生就业技能分析

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:hbzhwyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着机器学习技术的迅速发展,机器学习的分析方法也逐渐深入到社会各个领域中,成为行业分析的最重要手段之一。在学生就业前,使用机器学习方法分析学生已掌握的就业技能,能帮助学生明确自己的就业方向和职位,能显著提高学生的就业机会。鉴于此,提出使用机器学习中FP关联规则模型来分析学生掌握的技能与不同职位的匹配度,就可以分析出学生适合的职位。实验结果表明,所提方法能较准确地分析出不同学生所适合的职位,可作为学生就业分析的有效依据。
  关键词:大数据;机器学习;就业;tf-idf;画像
  中图分类号:TP391 文献标识码:A
  文章编号:1009- 3044(2019)34-0190-02
  当前很多学生在就业时都存在着迷茫,不知道什么工作适合自己,不知道自己能胜任什么样的工作;在招聘网站上寻找工作时,看到众多眼花缭乱的技能要求,却很多都不甚了解,不知道自己能胜任哪些工作职位。这些都源自学生对自身所学技能和工作所需技能不了解所造成的。
  本文从分析学生自身所掌握的技能与不同工作岗位所要求的技能出发,通过机器学习方式寻找同一行业方向的相似工作岗位所需的技能,使学生了解到当前行业所需的技能到底是怎样的,有什么样的趋势,然后通过分析学生个人自身掌握的技能向学生推荐其工作领域。从而帮助学生提升自己能力,并提高找到适合工作的机会,为学生未来的发展提供一个参考。
  1 模型分析
  1.1 职位通用技能组
  实际工作中总会遇到各种不同的项目和问题,这就要求应聘者必须具备处理复杂问题的多种技能。因此,通常一个职位对技能的要求并不是单一的,而是一系列的相关技能的组合,以大数据开发工程师为例,该职位通常会要求应聘者具备Spark,Hadoop,Kafka等一系列分布式数据处理的相关技能,如下表所示:
  由表1可知,不同招聘信息中同一职位中要求的职业技能通常是一组相关的技能,这些技能有的在多个招聘信息中多次出现,如表中的Spark和Hadoop等,另一些技能则仅在某个或少数招聘信息中出现,如Perl、MySql。后者所需的职位不多,应聘者即便掌握也不易在应聘中遇到;而前者则具有普遍性,掌握后能符合多数招聘信息需求,这部分技能才是文中进行职位匹配所关注的。因此,通过FP关联模型将同一职位中常用的相关技能提取出来形成该职位的通用技能组,如下图所示:
  1.2 个人就业技能画像
  要实现对精确到个人的职位推荐,还需要了解每个应聘者所掌握的就业技能。对于学生,这些技能通常来自于课程学习,或者从课外项目或假期实践中学到。因此,个人就业技能画像数据就来自以下两个方面:
  1)与学校教务处的课程学习数据库连接,按专业获取每个学生所学课程,从中提取出相关课程所教授的技能;
  2)当学生登录系统时,在个人账号中补充自己在课程之外所掌握的技能。
  系统中,学生在课外掌握的技能即使以课程内技能补充的形式记录,也可能因为输入者对技能的理解不一致等原因导致同一技能被以不同的名称等形式重复输入。因此,两处数据源中的数据可能存在重复或同一技能不同名称等问题,所以还需对数据整合并通过TF-IDF词频分析和ALS模型进行数据清洗,清洗后就得到了个人就业技能的画像,如下图所示:
  1.3 职位推荐
  职位推荐不但需要向该学生推荐匹配度最高的职位,还需要为该学生分析出对指定职位仍欠缺的技能。
  当向学生推荐匹配度最高的职位时,使用学生所掌握的技能和每个职位的通用就业技能组进行匹配。由于是与职位的通用技能匹配,因此不再考虑技能的支持度与置信度。比较学生掌握的技能与FP模型中每个职业的通用技能组中的技能,以技能匹配个数为标准,匹配个数最多的一个或多个职位就是与该学生最吻合的职位,如图3所示:
  上图中左侧是推荐的职位,右侧是学生所掌握的该职位中的通用就业技能。从图2中可以看出,与图2中学生所掌握的技能最匹配的是大数据开发工程师、大数据开发负责人、大数据存储工程师三个职位,每个职位的通用技能组中都有五个技能是该学生所掌握的。这也是该学生掌握的技能中与职位通用技能匹配最多的个数,因此认为这三个职位最合适该学生。
  当学生表露出对某一职位感兴趣时,还需要分析该职位的通用就业技能组中的哪些技能是该学生没有掌握的,以此提高学生对自己需要掌握的技能树的认识。将学生感兴趣的职位的通用技能从FP模型中提取出后,再与学生所掌握的技能进行对比,就可以知道该学生为应聘该职位所需要的努力方向了。重新选择另一个只学习了较少大数据知识的学生应聘算法工程师、Web开发工程师和大数据工程师进行技能分析,分析结果如下图所示:
  从图4中可以看到系统分析出了该学生应聘这三个职位还需要掌握的技能。
  通过系统分析,就能很清楚地看到学生所适合的职位,以及应聘某个职位时还需要掌握的技能。这就为学生进入职场时对自身的认识和就业方向提供了一个可靠的参考。
  2 结束语
  實验结果表明,所提方法能较准确地通过学生自身掌握的技能和招聘信息中不同职位的通用技能组的匹配来分析出每个学生所适合的职位,以及应聘某个职位时应聘者所具有的优势和欠缺的技能,从而为不同的学生提供一个精确到个人的就业参考。
  参考文献:
  [1]孙怡帆,潘昆峰,孙正阳,等.大学生毕业去向预测的思路与方法——基于机器学习算法的尝试[J].教育学术月刊,2019(5).
  [2]李佐军,大数据时代下关联规则兴趣度挖掘在就业分析中的应用[J].软件工程,2018(9).
  [3]赵力衡,陈虹君.基于机器学习的招聘信息中就业技能提取的应用分析[J].电脑知识与技术,2019(13).
  [4]姜绍俊,大数据支撑下的机器学习算法[J].电脑知识与技术,2018(2).
  [5]王芳,申贵成.机器学习算法在用户行为中的应用[J].电脑知识与技术,2017(9).
  【通联编辑:唐一东】
  收稿日期:2019-08-16
  基金项目:基于机器学习的学生就业技能研究(2018JCKY0019)
  作者简介:赵力衡(1976-),男,四川成都人,高级工程师,硕士,主要研究方向为大数据、物联网;李丽华(1985-),女,重庆人,副教授,硕士,主要研究方向为物联网。
其他文献
摘要:在以计算机图形学为基础的三维可视化基础上,设计了作战试验三维可视化仿真系统。将三维空间理念引入到作战试验可视化显示中,具体阐述了作战标绘的三维模型构建、实时数据接收及解析、三维态势显示、雷达仿真分析,直观具体的表达了作战试验三维态势。通过大数据加载显示策略、粒子特效关键技术实现了良好的可视化效果,有效地提高了作战试验三维信息感知能力。  关键词:作战试验;三维可视化;仿真系统  中图分类号:
摘要:在使用Excel时查询是经常要用到的操作,与VLookup相比Lookup函数有很强大的查询功能。文章在介绍Lookup的常规用法的基础上通过实例详细介绍了“0/”的用法,以实现多种查询。  关键词:函数;Lookup;0/  中图分类号:TP391  文献标识码:A  文章编号:1009-3044(2019)34-0208-02  查找引用是Excel的基本功能之一,通常我们可以使用Vlo
摘要:随着科技革新和物联网发展,智能家居开始取代传统家电,成为人们日常生活中的必备品。本文介绍一款嵌入式智能婴儿床管控系统,该系统旨在利用物联网及自动化技术节省父母因照看哭闹婴儿的时间,同时为用户提供远程控制接口,使照看婴儿更加轻松、便捷。同时本系统提供人性化人机交互式接口,基于用户需求行进设计使体验更佳。此设备支持多种管控模式,用户可根据需要设置不同的模式,完成对婴儿床的控制。  关键词:安全;
摘要:有限元软件ANSYS在工业领域求解非线性多物理场有着非常广泛的应用,本文基于该软件对某企业生产的一轮胎定型硫化机开合模油缸活塞杆进行热一力耦合计算和分析。构建了螺纹配合下的活塞杆仿真模型,并进一步分析得出了在考虑高温工作下和未考虑高温工作下活塞杆受力状态的应力场,进行对比分析找出了该型硫化机长时间工作后密封性能下降的原因。其仿真方法和结果为有限元软件ANSYS应用于该型产品或同类产品的多物理
摘要:该文在研究国内外电能质量管理应用技术和项目总体架构的基础上,基于统一建模语言(UML)对电能质量管理系统进行系统设计与建模,通过UML分别设计系统的用例、静态、动态模型,在每个总体模型基础上都对其进行细化。使用UML建模可以缩短系统的开发周期,增加系统的可移植性。  关键词:电能质量;UML;系统设计  中图分类号:TP391 文献标识码:A  文章编号:1009-3044(2019)34-
摘要:随着目前VR/AR技术的发展,三维真实感图形技术已经发挥着越来越重要的作用,计算机图形学已经向各个学科领域渗透。该文采用参数方程变形及分型造型方法生成树木粗略造型。树枝是使圆柱变形得到几何形状,再利用L系统分形生成树木分支;树叶的生成是利用矩形变形得到几何形状,通过调整颜色模拟树叶。最后通过区域填充、消隐、简单光照模型基于MFC进行可视化设计。实验模拟结果表明本文造型方法可以迅速生成随机生长
摘要:卫生监督信息系统促使各级卫生监督机构之间交换、共享信息数据,使数据达到实时、动态、规范、完善的效果,极大地提高了卫生监督工作效率。该文围绕卫生监督信息系统的功能模块、系统应用阐述了卫生监督信息系统的结构与主要功能,特别是针对卫生监督信息系统在实际使用以及信息报告过程中遇到的常见问题,并提出了解决方法,为卫生监督信息系统今后的更新改进及维护提供参考。  关键词:卫生监督;信息系统;应用;日常维
摘要:在新一代天气雷达业务应用中,PUP软件调阅雷达产品是预报员做预报最常用的操作模式,由于雷达软件系统的升级,使产品索引文件从产生雷达产品开始产生,然后不断地追加产品信息,文件变得越来越大,如果依靠人工进行删除,不仅文件目录多,操作起来困难,而且从删除那刻起,要等下个雷达数据产生的时次再次生成索引文件,这样PUP软件调阅时只能显示再次生成索引文件时间的产品,之前的产品只能通过打开目录的方式单一调
摘要:随着信息技术的发展,软硬件系统越来越复杂,其中软硬件系统设计的正确性至关重要。形式化验证方法在硬件设计和软件开发等领域发挥越来越重要的作用,成为模拟验证的重要补充。本文主要介绍了形式化验证方法的发展现状并对其发展进行展望。  关键词:形式化验证方法;软件设计;硬件验证;模型检测;定理证明  中图分类号:TP301 文献标识码:A  文章编号:1009-3044(2019)34-0239-02
随着物联网概念的提出,包含了大量感知设备的物联网系统在各个领域越来越得以大量应用。感知设备时刻产生着大量孤立和异构的感知数据,形成数据孤岛。通过将不同设备及其产生的数据信息进行语义标注,从而构建不同域的数据关联模型,以便屏蔽数据异构性,实现语义信息的统一。该文以物联网为研究对象,提出对于宏观上的物联网系统从语义入手,结合语义网知识,介绍了语义标注的基本概念义、语义标注的方法及作用以及物联网传感数据