中文简历解析及招聘需求匹配算法研究

来源 :武汉邮电科学研究院 | 被引量 : 0次 | 上传用户:TimRealler
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着大数据时代的发展,企业招聘也由传统的线下招聘模式逐步转变为网络在线招聘模式,在线招聘凭借着成本低、易操作、足不出户便可投递简历等便利条件已成为企业招聘的主流模式。受今年疫情影响,国内很多企业效益下降,招聘人员相应减少,而每年的高校毕业生规模却呈逐步攀升态势,导致今年就业形势更加严峻,各企业收到的简历数量也远超往年,这对在线简历的匹配及筛选提出了更大的挑战。针对目前招聘网站不能实现简历信息的自动解析及智能匹配的问题,本文提出了中文简历自动解析及面向招聘领域简历需求的匹配和筛选算法。本文将个性化匹配与企业招聘场景相结合,基于自动化信息抽取、个性化匹配算法以及多指标评价算法,实现了根据企业招聘需求对简历进行自动化匹配。可根据企业对招聘者的个性化需求进行二次筛选,实现企业与求职者的精准匹配。本文的主要研究内容和创新点如下:(1)依据中文简历的层次化结构,对文本进行信息抽取,首先将不同格式简历文件统一转为txt格式,其次由于简历和招聘需求文本都有较为统一的格式,预研后提取块关键词对文本进行分块处理,文本块分为以下两种类型:文本块中包含属性关键词、文本块中不包含属性关键词。包含属性关键词的文本块按照属性关键词依次提取即可;对于不包含属性关键词的文本块,则需要根据对简历数据预研得到的经验定制规则进行提取。(2)根据简历的半结构化特性对招聘文本与简历进行信息匹配,将简历信息分为结构化与非结构化信息,采用“分而治之”的思路分别进行匹配。结构化信息中针对不同类型的文本采用不同的算法:数值类文本采用离散数值匹配;领域知识文本采用基于本体领域知识算法;岗位名称文本采用基于字符间的文本相似度算法。根据企业对求职者简历不同属性的偏好,对不同属性值进行加权求和得到结构化文本的匹配度。(3)采用基于预训练模型Elmo及句向量SIF抽取简历文本的关键词,实现简历的关键词检索匹配。对工作经历、自我评价等内容进行关键词抽取,提取语义丰富的行业关键词后,生成该份简历的关键词集合。根据企业提供的招聘关键词与简历关键词集合进行匹配。(4)针对目前简历在线招聘存在的信息匹配单一化、模板化的问题,利用TOPSIS算法对简历进行二次筛选。丰富简历的筛选维度,根据各公司不同的个性化招聘需求,如学历、工作经验、在校荣誉等个性化内容,筛选出更为适合的求职者。本文提出的结构化信息匹配算法相比于传统0-1规则匹配,F1值提升3%;非结构化文本采用Doc2vec向量模型,相较传统文本相似算法,F1值提升10%以上。采用的关键词抽取算法与主流算法相比,抽取关键词维度更多,抽取的关键词也更加完整。简历的二次筛选使信息匹配算法更具实用性。
其他文献
学位
合理地应用隔震技术可保证建筑在中、大震后的正常使用性能,对高烈度区体育馆建筑具有较强的适用性。以唐山新体育中心体育馆为例,对高烈度区体育馆建筑进行隔震设计研究。首先,对此体育馆进行刚性结构方案和隔震结构方案比选,以证明此体育馆采用隔震结构方案可减小构件截面尺寸、增大建筑使用空间,同时降低工程造价。其次,着重讨论了隔震层开洞、黏滞阻尼器布置及其位置等问题,通过在隔震层比赛场地区开洞且沿洞口周边布置黏
以沪深A股披露内控缺陷信息的企业作为样本对象,采用多期双重差分法(DID)研究内控缺陷修复信息披露对企业创新投入效率的影响及其形成机理。研究发现,内控缺陷修复信息披露能够显著促进企业创新投入效率的提升,且这种提升作用可以通过提高风险承担能力和降低研发操纵程度得以发挥。进一步研究发现,内控缺陷修复信息披露的主动性、全面性和真实性能够显著增强内控缺陷修复信息披露对企业创新投入效率的提升作用。研究结果表
生物学是一门抽象性强、实践性强的学科,单一的说教式教学已难以让学生轻松理解所学知识。利用信息技术手段辅助高中生物教学,能够把抽象的生物学知识变得简单形象,提高学生学习兴趣和内在动力,从而从本质上提高高中生物教学效果。本文分析了现阶段高中生物教学中的典型问题,探讨了基于信息技术优化高中生物教学的实践策略,以期为创新课堂教学模式、提升课堂教学效益做出努力。
随着教育体制的不断革新,信息技术在教学过程中也得到了广泛的运用。高中生物是一门强探究性,重理解和观察的学科,信息技术在生物学科中的运用可以大大促进教学方式的创新和提高教学效率。本文将着重阐述目前信息技术在高中生物学科中的应用现状与优势和不足,分析如何更好地在信息技术环境下进行高中生物学科教学的改革与探索,实现两者的高效结合,优化课堂质量。因此,高中生物学科在信息技术环境下的改革与探索就具有重要的实
期刊
在国内教育行业创新发展的推动下,国内学校在教学改革发展的过程中,增加对信息技术的应用,从根本上提升学校的教学质量和科技水平,有助于提升学校的教学水平,实现国内教育行业的高质量发展。针对初中生物科目的教育,在完善发展的过程中与信息技术进行整合应用,教师根据生物知识进行多元化的设计和发展,有利于提升学生的学习质量和综合素质,改变传统教育发展对学生思想方面的影响,注重培养学生的学习能力和自主探究实力,从
在有限的时间内获得最大的教学效率,一直是所有教师不断追求的目标,而在信息化技术飞速发展的今天,教学模式的创新已经成为目前教学改革的重要方向。借助现代教学手段融合生物教学,可以拓展学生视野,增强知识的直观性,促进师生之间的互动交流,从而提高教学效果。
根据已完成的四边不出筋密拼连接叠合双向板原位加载试验研究成果,分析了钢筋桁架叠合板与现浇板抗弯刚度、挠度存在差异的机理。考虑弯矩调整、裂缝分布、支座附加筋及钢筋桁架等因素引入相关挠度折减系数对既有挠度计算方法进行修正。基于ACI318有效惯性矩方法、修正ASCE方法对叠合板挠度进行理论计算得出,ACI318方法计算结果高估了叠合板弹性阶段刚度,修正ASCE方法适用于弹性阶段。解析刚度法结合修正挠度
针对平面阵列天线波束形成过程中的波达方向(direction of arrival, DOA)估计失配问题,采用在期望信号(signal of interest, SOI)方向附近增加线性约束的方法,有效提升了平面阵列波束形成的稳健性;此外,针对增加线性约束会导致波束形成算法自由度降低的问题,以均匀线阵为例,在广义旁瓣相消(generalized sidelobe canceller, GSC)算
随着5G移动通信的快速发展,毫米波天线日益成为当前研究和应用的热门天线形式。本文介绍了一种工作于毫米波频段的有源相控阵天线,阵面采用一体化有源阵列集成架构,T/R组件、馈电网络和阵列天线全部集成在一个多功能基板上。对所设计的有源相控阵天线进行了原理样机的研制,并进行了实验测试。