基于文本挖掘的岗位胜任力模型构建及企业招聘优化——以产品经理一职为例

来源 :云南大学 | 被引量 : 0次 | 上传用户:nomaryo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章运用文本挖掘的相关理论和技术成功构建了人力资源管理领域的岗位胜任力模型。岗位胜任力模型包含了一系列岗位胜任力要素,分为外显和内隐两大部分,它作为人力资源工作的基石和支柱,在企业的日常工作中尤其招聘环节有着非凡的影响力。然而,传统胜任力模型的构建花费成本高,数据采集周期长,评价结果具有主观性,不利于企业开展此项工作。以文本挖掘为主要技术手段的岗位胜任力模型构建便成为了文章的主要研究目的所在。论文通过爬取主流招聘网站的数据并进行清洗,选取了工作职责和任职要求的相应文本为主要研究对象,以无监督算法中的主题建模和文本聚类为主要研究方法,对岗位胜任力模型要素进行了全部聚类提取,成功构建了以产品经理这一职位为代表的岗位胜任力模型,这是文章的核心主题部分。而后在此胜任力模型的基础上科学生成了招聘信息文本,并运用相关算法计算出其与对应简历的文本相似度,以此达到了优化简历筛选工作的目的。文章在岗位胜任力要素提取方面主要运用了LDA主题建模技术以及基于Bert微调改进的孪生网络SBERT模型。LDA主题模型善于处理长文本,在不切分整条完整招聘信息的基础上,主要提取了岗位胜任力模型中的显性要素。而SBERT模型则是先在切分成独立单句的短文本招聘文本上使用句嵌入构建高纬度的句向量,再通过umap算法降维以及HDBSCAN算法聚类后,深入挖掘了岗位胜任力模型中另一重要的部分——内隐要素。主题建模与文本聚类互相补充,完成对胜任力模型的构建。文章最后使用TF-IDF算法进行余弦相似度分析,提出基于胜任力模型进行简历与招聘文本相似度匹配计算的方法,从而优化相关的简历筛选工作。论文从统计文本挖掘的角度成功构建了相关岗位的胜任力模型,效果良好,能够与主流企业的岗位用人要求相契合,对企业的人力资源管理工作具有良好指导意义。基于此模型进行的文本相似度计算能够高效处理人才的选拔筛选工作,值得进一步深入研究。
其他文献
随着国家乡村振兴战略的逐步深入,乡村文化充分发挥了日益巨大的社会功能,并逐渐成为乡村思想政治教育的重要载体。只有通过文化建设加强思想政治教育,落实新的发展观,激发乡村发展的内生动力,才能更好更快地推进乡村振兴。山西长治振兴村作为“全国乡村振兴示范村”,在长期社会发展中创造出了独具特色的乡村文化,即“三色”文化:以“根”、“孝”为核心的古色文化,以“听党话、跟党走”为核心的红色文化,以“生态保护、绿
学位
白酒作为中国特有产业之一,其不仅在我国具有悠久的历史和独特的民族文化内涵,也为推动国民经济做出了巨大贡献。研究影响白酒销售量的因素,能够帮助我们更好的把握白酒市场风向,及时调整销售战略。首先,在白酒销售量的影响因素分析中,由于数据存在重复测量、交叉测量等原因,自变量之间存在高度相关,随机误差项不满足零均值同方差等假设,传统估计方法显得捉襟见肘。为解决此问题,本文采用广义矩估计方法对模型参数进行估计
学位
机器学习模型的有效应用主要由数据、算法以及算力三个部分构成,眼下该类模型的研究热点为对机器学习算法部分进行改进。但是在现实应用领域中,主要制约着机器学习预测效果的因素是数据质量,特别是数据量少、数据类别多的情况下,数据的规模和质量将无法与算法的要求相匹配。因此,针对数据量小、类别多所导致的XGBoost模型训练和预测效果较差的问题,目前常用的方法有:在类别不均衡的样本中采取过采样或欠采样的方式;在
学位
近年来,随着我国社会组织结构和精神结构都出现了现象级的突破和改变,大家对于精神文化产品的需求逐渐提高,文化消费就越来越受到重视。文化消费本质上没有脱离经济活动的范畴,主要是指个人、机构、团体甚至国家通过个人、社会、网络等多种途径,购买文化产品或者相应服务(包括实物形式或者其他形式)开展消费的活动。与传统意义上的消费不同,文化消费主要集中于精神文化类方面。消费者通过对文化资源的购买、学习、欣赏和理解
学位
本研究基于全国31省市2003—2016年人均国内生产总值、第二产业增加值占比、城镇化、进出口量、人力资本、财政分权等18个涵盖经济三大产业,政法制度、科技投入的数据,分析经济政策因素对各省市环境影响程度。论文首先建立基于不同惩罚函数下的支持向量机(Support Vector Machine,SVM)二分类与多分类模型,考虑的惩罚函数包括:SCAD、弹性网络、弹性SCAD惩罚函数,根据不同模型下
学位
近年来,随着人工智能理论与技术的迅猛发展,以深度神经网络为代表的深度学习方法受到了极大的关注,取得了长足的进步。其中的代表之一,在医学图像智能识别和辅助诊断领域,由全卷积网络发展而来的U-net网络发挥了重要作用,成为医学图像识别与分割的最基础和重要的工具之一。目前,医学图像领域所使用的深度神经网络,包括U-net在内,采用的激活函数基本都默认是Re LU。而激活函数作为神经网络中重要的组成部分,
学位
如今社会的发展离不开人工智能及各种高精尖芯片的开发。作为国家的软实力,精细图案的制造转移是不可缺少的技术工艺。光刻便是实现精细图案化的有力手段。在光刻过程中,光刻胶是微电子技术微细图形加工中必不可少的材料之一。虽然我国在这一方面有着巨大的市场需求,但就高端市场而言,我国自主生产力较低,每年有70%以上的光刻胶来源于进口市场,且在一些设备上我们受到了进口限制,所以现在急需一种简便、普适的光刻图案化方
学位
咖啡在发达国家早已形成成熟的消费者市场,在国内则刚刚作为一种文化符号开始兴起,咖啡产业在国内外都有巨大的市场潜力。云南咖啡品质优良、风味醇香,已成为众多龙头咖啡品牌的咖啡豆原料来源。由于市场垄断和云南咖啡自身营销力度不足等原因,国人却鲜少了解到云南盛产优质咖啡且云南有众多优质咖啡品牌。云南咖啡有着品质优良及价格亲民等优势,大力推行云南咖啡不仅能带动该省的经济发展,也可以对外资企业在咖啡行业长期垄断
学位
《泰晤士报》作为英国第一大报,具有较大的国际影响力,它刊登了一系列国际新能源发展动态的相关报道,构建了独特及持续性的新能源话语。自建“《泰晤士报》新能源报道语料库”(2002—2021年),采用语料库辅助的批评话语分析理论框架,通过主题词、搭配词、索引行分析新能源话语的特性和倾向性:英国全面致力于新能源发展,新能源的相关报导持续增长;传统能源逐渐向新能源转型,财经是影响新能源发展的主要因素;新能源
期刊
近年来随着互联网的普及,“流媒体”时代到来,推荐系统技术备受各大互联网公司的广泛关注和研究。特别是被抖音、快手、instagram以及Netflix等这些大公司或App所应用,每天不断的推送“短视频”或资讯给各类不同的用户。然而面临互联网每天产生的海量数据,如何有效且优质的推送信息是各大公司面临的一个重要问题,同时也是无数研究者的热门研究课题。在众多推荐系统中,矩阵分解是推荐系统中一种广泛使用的协
学位