基于Web招聘信息的文本挖掘系统研究

被引量 : 0次 | 上传用户:zhangfuliangez
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机的普及以及互联网技术的飞速发展,Web上的招聘信息量越来越庞大,同时越来越多的高校毕业生倾向于从网络搜寻招聘信息。这些信息反映了用人单位对人才的使用要求,同时,为高等院校及时了解社会对人才的需求,开设专业,安排课程,提供了有价值的信息,也对学生的学习起到了促进的作用。为此,如何从海量的Web信息中快速有效地获取所需要的招聘信息,如何发现这些信息中隐含的知识模式,是一个非常值得研究的课题,这也使得Web文本挖掘技术成为数据挖掘中一个研究的热点。本文首先介绍了Web文本挖掘的研究背景、研究意义和国内外的研究现状,以及文章的主要研究内容和结构安排。其次,研究了Web文本挖掘的一般过程,主要包括网页采集、预处理、网页净化、分词、特征表示、特征选取和文本聚类技术。接着,本文探讨了相关性分析技术。介绍了相关性分析的概念和相关关系,给出了相关系数的计算方法和显著性检验。然后,针对中文文本的聚类,本文设计了Web招聘信息挖掘系统。对文本挖掘系统中各个功能模块进行了详细的分析和设计。最后,对Web招聘信息挖掘系统进行了实现,并进行了实验分析研究。实验结果表明,本系统主要的性能指标基本令人满意,具有较好的实际应用价值。
其他文献
班级是学校教育教学的基本单位,是学生在学校生活与学习的基层组织,是学生健康成长的最直接的坏境,而班级管理的情况对于学生的成长和学校教育目标的实现有着重要意义。为了
目的分析胸腔镜下胸腺切除术治疗胸腺瘤合并重症肌无力患者的效果。方法研究阶段为2015年6月1日至2017年12月31日,共纳入研究对象36例,均为胸腺瘤合并重症肌无力患者,采用随
作者讨论了具有优异宽温区特性的多孔PTFE和多孔PP复合膜的电荷储存稳定性.工作在常温常湿条件下的这类多孔复合膜呈现优异的电荷储存稳定性;与传统的驻极体过滤材料聚丙烯无
背景与目的子痫前期是妊娠期特发性疾病,以孕20周后出现高血压、蛋白尿、水肿为主要特点的多脏器损害疾病。子痫前期在我国的发病率为9.4%,该病严重威胁母婴健康,是孕产妇和
在深入分析庭院经济内涵、效益和制约因素的基础上提出发展庭院经济的对策建议。
本文从政策工具、消费需求和生产供给三个维度构建了新能源汽车产业发展和推广应用的分析框架,并且在对新能源汽车发展大势进行深入剖析的基础上,对标分析目前成都市发展新能
通过筛选近五年SCI源期刊中影响因子较高的针灸治疗膝骨性关节炎的临床试验文献,纳入由国外学者所设计的临床试验,通过信息提取,分析其研究方法及特点,发现其干预设计缺乏中
目的对比分析电视胸腔镜手术与胸骨正中劈开手术在治疗胸腺瘤合并重症肌无力的临床效果。方法选取开胸及胸腔镜治疗胸腺瘤及合并重症肌无力患者各30例,比较两组患者的临床治
音乐所要表达的是感情,所以在音乐的教学中,老师与学生应把感情作为交流的重点。老师可以通过为音乐赋予情感让学生能够深刻理解作品所要表达的含义,同样学生也可以根据自身
目的减轻眩晕症状,缩短病程,预防复发。方法将100例患者分为对照组和实验组,分别给予常规治疗,对照组实行常规护理,实验组在常规护理基础上加用中医整体护理。结果实验组治疗