论文部分内容阅读
关联规则挖掘(Association Rule Mining, ARM),用于从海量数据中挖掘有价值数据项之间的关联关系,从而发现隐含的、事先未知的、对决策有潜在价值的用户感兴趣知识,关联规则挖掘是当前数据挖掘领域中最受瞩目的研究方向之一,具有重要的研究价值和广阔的应用前景。论文深入分析国内现有的人力资源网站,针对目前人力资源网站趋势统计数据研究领域的薄弱之处,提出应用关联规则算法分析网站趋势统计数据。同时,基于关联规则可以有效地分析数据之间的关联性并找出有价值规律的特性,本文将关联规则挖掘引入人力资源网站趋势统计数据分析中,对传统Apriori算法从减少候选项数目和数据库扫描次数两个角度进行改进,并应用改进的关联规则Apriori算法,构建人力资源网站趋势统计数据的测试平台,实现人力资源网站趋势分析功能。本人的主要工作包括:(1)针对关联规则挖掘Apriori算法存在的候选项集数量大和多次扫描数据库的问题,提出了基于增加数据预处理过程和创建新事务组的改进关联规则Apriori算法。改进Apriori算法节省了处理部分候选项目集所需的计算时间和存储空间,有效提高关联规则的挖掘效率。(2)创建基于用户、职位、面试题三维动态评估人力资源网站模型,采用具有高扩展性的LAMP (Linux+Apache+Mysql+PHP)组合架构,基于社区论坛Discuz系统框架,使用美工设计与程序设计分离的Nemo模板引擎,根据需求分析设计实现了“面试百科网站”。(3)基于人力资源网站的应用环境,结合改进关联规则Apriori算法,实现人力资源网站的统计数据趋势预测平台,并进行两种算法在人力资源网站统计趋势分析的性能测试比较实验。实验结果表明,改进算法可以有效地提高人力资源网站趋势分析的计算效率,为网站运营维护提供重要参考依据。