论文部分内容阅读
近些年来,随着人类社会的进步,互联网行业快速发展,社会的信息量不断地累计,呈现爆炸式增长,可以说大数据时代已经全面到来。同时,网络招聘作为企业招聘人才的一种重要方式,相对于流程繁琐,耗费大量时间,沟通渠道狭窄的线下招聘,网络招聘成本低,灵活性、针对性强,资源充足,覆盖面较广,通常是当代高校学生在求职时需要密切关注的信息来源。随着网络招聘规模的增长,大量招聘网站出现,而这些网站中包含的招聘信息也为研究者提供了大量的数据。因此通过对招聘网站数据进行分析,可以探究相关企业单位对职业能力要求以及人才需求状况,同时可以给在校大学生用户提供一个比较客观的参考。本文的招聘数据可视化平台主要采用了基于Python的Django框架进行设计。首先,利用网络爬虫将所需要的信息爬取出来,然后将采集到的数据存储到数据库中。其次,对采集到的招聘数据进行预处理,利用分词工具将数据进行分词、去停用词后抽取出属于岗位需求特征的核心词语,从多个维度对招聘数据进行分析研究。由于中文语言的不确定性和计算机岗位的特性,在岗位描述中存在着许多技能性词语,一般的通用字典在处理这些技能关键词时在分词上不太准确,在一定程度上会影响分词的结果。因此本文构建了专门的技能词典,参考网络招聘信息和权威发布的热点词汇,将相关的专业名词以自定义词典的方式载入到jieba分词工具中,从而提高文本分析的效率。最后,通过ECharts可视化框架对数据分析的图形化结果进行展示,可以帮助用户有效的理解数据、发现模式。本文主要选取了拉勾网、前程无忧和智联招聘作为招聘数据采集的网站,主要以计算机相关岗位为例,总体分析了不同地区的职位的分布情况以及不同岗位的工作经验要求,学历要求以及工作薪资。通过对不同岗位的数据进行分析,可以清晰的了解公司对不同岗位的具体要求,能够为求职者提供一个比较客观的参考标准,可以帮助求职者比较直观的了解当前计算机行业对人才需求的标准和薪资情况。因此基于对招聘网站数据可视化分析平台的使用,可以帮助求职者做出更好的职业规划。同时,也能够为求职者提供辅助决策支持,避免与社会、公司需求脱节。