基于Scrapy框架招聘信息检索系统的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:slgull
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随互联网行业的快速发展,互联网用户借助搜索引擎的帮助,可以驾轻就熟地在互联网上搜索到大量的信息。所以,如何建立连接、获取信息已经不再是困扰用户的难题了。在求职招聘领域中,通过互联网进行求职和招聘的方式也日益成为人们的首要选择。传统的招聘网站因涉及几乎所有专业领域而很难搜集到足够全的招聘信息。同时,因为专业领域的不同,所以不能够针对获取的招聘信息进行深层次的分析,也就不能为用户提供具有参考价值的招聘信息分析服务。在新的互联网时代,求职者不再倾向于为这样大而粗犷的信息处理方式埋单,求职者迫切需要一个立足于特定专业领域的招聘信息搜索引擎。本文设计开发的招聘信息检索系统实质上是一种招聘信息搜索引擎,其立足于计算机、软件工程专业细分领域,旨在为软件工程领域人才提供小而精细化的服务。在进行系统设计开发工作过程中,首先,在对多个招聘网站进行分析的基础上,收集用户需求,对系统进行建模工作,并最终确立系统的功能需求;其次,研究了大量信息检索类系统有关的技术和文献,给出了系统的架构设计,对确立的系统功能需求进行功能分解,并针对各个细分的功能实施开发工作;最后,对开发完成的各个细分的功能模块进行集成工作,并对集成完成的系统进行测试。本文设计开发的基于Scrapy框架招聘信息检索系统的主要功能有:用户注册、登录、验证,招聘信息检索,招聘信息分析,招聘信息发布,招聘信息搜集,招聘信息格式化、存储,管理注册用户,管理招聘信息等。在构建招聘信息检索系统的过程中,采用Scrapy开源爬虫框架中的Spider模块开发多个针对特定招聘网站的网页爬虫程序,这些爬虫程序对招聘网站网页上的招聘信息进行搜集;使用Scrapy框架中的Item Pipeline模块将爬虫程序搜集到的招聘信息进行格式化处理,并通过RESTful接口将格式化后的信息持久化存储到Elasticsearch搜索服务器集群中;为了向求职用户提供简单易用的招聘信息检索方式,使用Yii开源PHP框架开发业务处理模块用以处理来自Web浏览器端的用户请求。本文设计开发的招聘信息检索系统的意义在于,通过对多个招聘信息网站进行信息整合,为计算机、软件工程领域人才提供一个信息更加全面的招聘信息检索系统。系统的测试结果表明,本文设计开发的基于Scrapy框架招聘信息检索系统能够满足计算机、软件工程专业领域人才对招聘信息检索系统的功能需求。同时,系统提供的招聘信息分析的服务能够提供有效的指导作用,达到了预期设定的目标。
其他文献
以人为本的现代教学观,认为学生是认知的主体。教学活动应转向以学习者为中心的轨道。以学生为主,强调自主学习。英语教学中"自主学习"的教学模式的实践与探索,旨在培养学生
本研究从夏橙、椪柑、柠檬、蜜柑果皮中提取精油,对精油成分构成进行差异分析,采用高速逆流色谱(HSCCC)分离椪柑精油主要成分;以两种体外抗氧化测试方法评价柑橘精油及其主要
半命题作文最大特点是:要把题目补完整才能开始写作,有一半或一部分的命题权放在了作者手里,它体现了自由与束缚的统一,限制与开放的融合。写好半命题作文的关键是补好题目。
打倒"四人帮"头几年配合默契打倒"四人帮"后头几年里,邓小平与陈云互相支持,配合默契。在1977年3月的中共中央工作会议上,陈云顶着政治压力,发言要求让邓小平重新出来工作。1978
从小就渴望有一张书桌,可以摆放我想读的书和资料,喜欢乱乱地摊开,随意翻看,信手涂鸦,甚至对着书本发发呆。可谁承想,这个愿望竟是不易实现的。小时候一家四口蜗居于斗室之中
尤文肉瘤是常见的原发恶性骨肿瘤,严重危害青少年的身体健康。通过规范的化疗、手术及放疗,很多患者可达到痊愈,但不当的诊疗过程可能造成严重的不良后果。中国医师协会骨科
加重犯分为结果加重犯与情节加重犯两类,二者的区别在于:结果加重犯的加重结果超出了基本构成要件的范畴,而情节加重犯的加重情节则在基本构成要件之内;情节加重犯之加重情节
随着工业现代化水平的不断提高,自然环境的污染以及遗传、气候生活条件(如装修材料)等诸多因素的影响,致使哮喘患儿的发病率逐年增加,严重危害儿童的身心健康,使其生活质量下降,常
监督公权力的重心不在于规范领导秘书,更不在于规范领导家人,而在于如何规训领导权力本身。
以安徽省为例,通过分析当前区域经济发展的现状与特点,从服务区域经济发展的视角,分析外向型经济发展对商务英语人才的需求情况,探讨外向型企业需求与商务英语人才培养之间的