文本分类算法研究及其在校园招聘管理系统的实现

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:asdf07124029
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时代的发展,现代办公环境对自动化、无纸化的去人工管理方法需求越来越大。某些大型公司都纷纷建立起了自己的招聘系统,求职者通过在其系统上提交自己的电子简历来争取面试的机会。随着公司规模的扩大和求职者数量的增多,电子简历的管理和筛选分类逐渐成为需要消耗大量人力所完成的工作。为了增强简历管理和筛选分类工作的自动化强度,本文设计并实现了基于文本分类算法的校园招聘管理系统,并在某大型公司的招聘中得到了应用。本文主要工作有:1.研究了IG特征选择算法,并对其进行了改进。通过在IG特征选择算法评估函数中引入了频度和分散度,改进了IG特征选择算法,弥补了原有IG算法偏好低频词的缺点,通过实验证明此改进方式提高了IG特征选择算法的性能。研究了CHI特征选择算法以及针对CHI算法的改进策略,通过实验对改进的CHI算法进行了性能验证,并进对改进的IG特征选择算法和改进的CHI特征选择算法性能对比分析。2.研究实现了C4.5决策树算法和SVM分类算法。对C4.5决策树算法信息增益率属性选择与悲观剪枝分析,并在Weka软件上进行了算法实现,得到了C4.5决策树算法分类结果;对SVM分类算法原理进行了研究,对SVM核函数和惩罚参数进行了分析,通过实验对SVM分类算法的核函数、惩罚参数进行了寻优,最终确定了针对简历文本分类的SVM最优核函数、最优惩罚参数。3.设计了基于改进文本分类的校园招聘管理系统。设计了系统的总体功能、开发体系结构和开发框架;重点设计了结合改进文本分类算法的3个创新模块,即:学生简历管理模块、简历匹配模块和评星管理模块。4.实现了学生简历管理、简历匹配和评星管理3个主要模块:系统学生简历Excel导出功能、优化SVM分类器预测结果Excel导入功能、预测结果匹配功能以及C4.5决策树结果定义评星标准的功能。运行改进的校园招聘管理系统各个模块后表明系统中的各模块运行稳定、操作简单、通过结合优化SVM分类器预测,增强了系统的功能性和指导性。
其他文献
“一带一路”的持续发展进一步密切了中国与沿线各国的经济往来,港口设施建设是跨境重大工程项目投资中一个关键和核心的领域,其中斯里兰卡科伦坡港口城是我国投入海上丝绸之路建设的一个重大工程项目。推进“一带一路”倡议的同时更应该关注其潜在经济风险、政治风险、社会风险以及法律风险,加强对重大项目的投资风险管理。而投资风险预警就是对风险进行实现预测和报警,通过对斯里兰卡科伦坡港口的投资风险进行研究从而了解其存
银联支付服务公司的交易数据分析系统是其整体业务平台的重要组成部分,基本目的是基于正常的业务交易数据进行全局性分析,从中得出各类银行卡通过银联平台完成交易支付的特点
二阶锥规划(SOCP)是一类凸优化问题,为了处理SOCP中数据的不确定性,具有补偿的两阶段随机二阶锥规划问题成为研究的热点问题,如随机欧几里得设施位置问题、具有损失风险约束
人生最浪漫的事,是两个相爱的人手牵着手,一起白头偕老。结婚照,她见证了婚姻的存在。两个原本没有多少关系的人,从相逢、相爱、相许到永恒,照像机镜头将爱情定格在最动人的
期刊
1.故障现象1台全新的彭浦PD320Y型履带式推土机投入使用10h后,出现推土铲无法提升到预定高度故障。刚出现故障时,推土铲只能将机身撑起10cm左右,操纵手柄回到中位时,机身会回
目的细胞自噬的功能状态对于运动诱导的肌细胞自噬激活以调节肌肉代谢、内环境稳态水平而实现运动适应与运动能力提高有着重要意义。本文旨在通过不同运动方式及运动时间的小
光电检测具有精度高、体积小、延时低等优点,较传统的传感器检测有较大优势,被广泛应用于环境监测、工业监测等领域,具有较好的应用前景。论文以风力发电机组的功率及载荷控制为应用背景,利用激光雷达风速检测方法与光纤光栅叶片载荷检测方法对于风机控制所需的状态变量进行检测,并针对风力发电机组的不同运行工作区设计最大功率跟踪和独立变桨载荷控制策略。本文首先论述了风力发电机关于风速、叶片载荷检测技术的研究现状。针
$F编者按:$E$T在策划《周末画报》这个选题时,我们有意选取了与《周末画报》合作的广告客户,广告代理公司,竞争者(周报和城市生活类杂志),平面媒体从业者和平面媒体研究者,请他们从各
报纸
为满足毛峰茶生产加工产业化的市场需求,对毛峰茶自动化生产线设备开展研究。文章系统而全面地介绍了黄山毛峰茶加工生产线设备的组成和各工序组合单元设备的结构原理、工艺
目的探讨非小细胞肺癌(non-small cell lung cancer,NSCLC)的相关驱动基因及其突变率和相关影响因素。方法本研究采用第二代测序技术(Next-generation sequencing,NGS)对入组