论文部分内容阅读
随着互联网普及率的升高,社交网络的兴起也已成为现代社会的流行和趋势,各个传统行业基于社交网络的工作模式改变也应运而生。在社交网络中,个体与个体之间有频繁的交流互动记录,个体的语言、行为及状态更容易被记录与获取,提供了海量可供研究分析的用户社交网络和行为模式数据,也促进了社交招聘的发展。基于社交网络数据,对用户的求职意向进行多维度分析,一方面有助于求职方对职业生涯的进一步规划,另一方面,对招聘方,如人力资源专员、猎头,也有利于其在进行社交招聘时对职位潜在候选人进行更全面深入的了解,减少招聘过程中的成本与时间。基于这些目的,本文的主要工作有以下几个方面:首先,根据新浪微博平台特点,以网页爬虫和新浪应用API两种方式,构建实时并行的新浪微博数据采集爬虫系统,对微博用户数据进行获取,并针对新浪微博文本特点进行数据预处理。其次,职业性格对职业的选择以及职业的成功有着重要影响,是本文分析求职意向的一个重要维度。本文基于人力资源界普遍使用的Myers-Briggs Type Indicator人格类型量表(简称MBTI),对用户基于四种维度划分的职业性格进行建模分析。针对已爬取的微博用户职业性格数据集中,本文从文本特征和社交特征两个方面,进行特征选取。其中,对于文本主题特征的分析,本文使用LDA模型进行主题生成,以体现用户的潜在语义信息。最终对选取特征进行相关性分析,并在此基础上建立对微博用户职业性格的建模,通过模型可对微博用户职业性格进行预测。再次,由于对用户的求职意向分析是具象的,需要从多个维度进行评估,才能进行详细刻画。本文从求职者和招聘者两方面衡量,选取职业背景、专业影响力、职业性格、行为模式、工作地点五个维度进行分析,详细刻画了用户的求职意向。最后,本文根据实际应用中的用户需求,设计并搭建了整套系统应用架构。该系统可为求职者和招聘方,提供针对用户自身或指定新浪微博用户的求职意向分析,包括基于分布式集群的数据采集、消息通信、模型分析、接口服务、结果展示等功能。通过系统用户的使用反馈,实际证明了对用户的求职意向的多维分析是可行有效的。