应用统计人才岗位需求现状及薪资预测分析

来源 :重庆大学 | 被引量 : 0次 | 上传用户:sophia_deng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
应用统计硕士专业因其跨考门槛低、就业范围广,近几年已成为了考研的爆火专业,且每年的报考热度只增不减。该专业的学生同时具备数理统计基础与计算机应用能力,因此该专业应用方向开阔,就业市场广泛,涉及金融、互联网、人工智能等多个热门领域。在这样的大趋势下,为了探究目前应用统计人才的就业发展状况,本文通过收集应统类人才的岗位招聘数据,分析其就业需求现状并建立薪资预测模型,旨在帮助求职者了解就业形势,同时为应用统计类人才的发展与高校学科建设提出针对性的建议。本文运用网络爬虫技术收集到了与应用统计相关的网络招聘数据,针对结构化数据进行了格式调整,针对非结构化数据采取了jieba分词与去停用词的处理。在处理完毕后对数据进行了统计研究与可视化展示,同时运用K-means算法对职位信息的文本数据进行了聚类处理,将用人单位对求职者的能力需求划分为不同的类别,进而从就业前景和能力需求两方面对应统类人才的就业需求现状进行了分析。为建立薪资预测模型,分别运用TF-IDF、Word2Vec、BERT三种方法生成了文本数据的词向量,并结合余弦距离对文本相似度进行了刻画,最后基于协同过滤推荐算法建立了薪资预测模型,并对模型效果进行了评价。研究结果显示,目前应用统计类人才的就业前景与就业福利较好,新一线与一线城市的就业机会较多,同时就业行业范围广,其中以信息传输、软件和信息技术服务业为主。用人单位对于应聘者的实操能力、业务能力、专业基础和个人素质有着较高的要求,对R、Python、SQL等编程语言的技能掌握需求尤为突出。在建立薪资预测模型的过程中,发现基于BERT模型生成的词向量在相似度的刻画中表现最好,其中皮尔逊相关系数达到了0.8552,斯皮尔曼相关系数达到了0.8332,比TF-IDF算法与Word2Vec算法分别高出了0.139和0.0759。同时基于协同过滤算法构建的薪资预测模型在薪资下限与薪资上限预测中的MSE分别为0.36和0.79,预测效果较好。
其他文献
数据挖掘是一项带领人类从数据时代跨越到信息时代的技术。作为数据挖掘中的重要研究课题之一,聚类分析已引起了人们的广泛关注,并被成功应用于视觉分析、模式识别、隐私保护等众多领域。近年来,随着科技的进步,数据的获取、存储等技术取得了显著进展,数据结构越来越复杂,数据体量呈几何级数高速增长,这给聚类分析带来了新的挑战。本文通过分析聚类的相关理论与算法,针对复杂结构数据集的聚类问题展开了研究,主要工作与取得
学位
糖尿病与一系列可表现为糖尿病血管并发症的大血管和微血管病变密切相关。糖尿病下肢缺血(Hindlimb ischemia,HLI)是常见的糖尿病血管并发症之一。即使先天性血管生成可诱导新血管的形成并促进血液灌注以应对轻度HLI患者,但高血糖会造成全身性功能障碍,从而导致血运重建潜能受损。且糖尿病HLI患者由于血管损伤严重、复发率高而更难以治愈且不适用于血管基础治疗。治疗性血管生成旨在诱导内源血管新生
学位
车辆系统动力学仿真与预见控制需要精确的车辆模型,例如多体系统动力学模型。尽管目前存在许多第三方汽车仿真建模与动力学分析软件,如ADAMS等能够较为准确地进行车辆动力学分析,但它们在复杂的驾驶工况下模型求解不稳定,计算效率偏低,在处理碰撞分析和参数不确定性问题时有较大的困难。为了实现车辆特别是智能汽车的预见控制,需要车辆系统的精确实时仿真。本文提出了一种基于深度神经网络算法的数据驱动建模方法,用于计
学位
碳达峰碳中和战略目标下,节能低碳成为发展的必然选择。新能源汽车以高环保度、低能耗优势,成为众多国家汽车产业减排降碳和改善能源消费结构的必然选择。消费者对新能源汽车的意愿支付直接影响其发展推广,与对传统汽车的意愿支付相比,消费者对新能源汽车的意愿支付包含额外的环保意识。随着消费者对新能源汽车意愿支付的提升以及补贴等利好政策实施,我国新能源汽车产销量逐年递增。在新能源汽车与传统汽车竞争阶段,亟需关注消
学位
伴随着轮式移动机器人领域理论研究的深入、科学技术的飞速发展以及基础硬件的更新换代,更高精度的传感器、更快速的处理器、更先进的控制理论都让轮式移动机器人在各种生产生活领域有了展现自身优势的机会。在无人运输领域,轮式移动机器人凭借着简单的车身结构和优秀的承载能力被广泛应用。本文研究的六轮差速移动机器人主要应用于资源站到资源站点对点的物资运输,机器人的六轮差速结构不仅具备轮式机器人的基本优点,还具有良好
学位
我国育龄夫妇生育力呈下降趋势,不孕发病率逐年增长,愈来愈多生育困难的夫妇选择借助辅助生殖技术获得支持;医疗技术水平上,我国辅助生殖技术发展迅速,在综合医院中已逐步取得全面推广应用,截至2020年已增加至536家;国家在政策上陆续发布了“三孩”鼓励政策、辅助生殖机构建设推动政策、辅助生殖相关医疗保障政策等,这些政策都有利于推动辅助生殖医学中心的建设与发展。而全国大部分综合医院在建设之初,往往未考虑辅
学位
作为一种清洁、安全、经济、有效的膜分离技术,超滤(ultrafiltration,UF)在净水处理和污水回用领域发挥着重要作用。然而,超滤在运行过程中,不可避免会产生膜污染。膜污染会大大降低产水量、恶化出水水质、缩短膜使用寿命,从而显著增加投资运行成本。在众多膜污染控制方式中,膜改性可以通过调控膜的本身固有特性,从污染构建的初始阶段有效地减少膜与污染物之间的相互作用,在膜污染控制方面表现出巨大的潜
学位
信贷业务是银行业务的重要组成部分,对申请贷款者的还款能力进行评估是信贷业务中极为关键的一个环节。经过多年的发展,信用评估已经形成了一套成熟的方法体系。但是随着大数据时代的到来,基于逻辑回归的传统风控体系的弊端不断凸显。机器学习算法,由于引入了非线性因素,具有更强的拟合能力,能够从海量数据中挖掘出有价值的信息,越来越受到风险评估领域的青睐。因此,如何使用机器学习算法改进现有的信用评估模型,提升模型预
学位
换流变压器作为直流输电系统的核心设备,其运行可靠性不仅关系自身的使用寿命,更关乎电力系统的安全稳定。然而,由于换流变压器供电容量与结构尺寸的失衡性增长,且两侧绕组内存在大量的高次谐波电流,使得其内局部过热的现象日益严重。当换流变压器热点温度(温度最高点)超过规定限值时,会加速其主要绝缘材料的老化,甚至造成绝缘击穿。因此,准确并快速获取换流变压器内部温度场分布特性以及热点温度信息,对换流变压器的绝缘
学位
随着深度神经网络的快速发展,深度学习模型已经逐渐深入到军事、身份识别、医疗、自动驾驶等多个场景中。然而,最近的研究表明,对于输入样本中精心添加的轻微扰动,深度学习模型会以极高的置信度对其做出错误的判别,我们将这种输入称为对抗样本。对抗样本的问题暴露了深度学习模型在敏感领域应用的安全风险。目前已经有很多工作通过研究对抗样本的生成来增强模型的鲁棒性,其中大多数生成算法都通过对输入进行全局扰动的方式来实
学位