基于Hadoop的Apriori算法研究与优化

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户：SAGDGJGU

【摘要】

：

为解决传统数据挖掘算法在大量数据处理时面临的内存占用、计算性能等方面的问题,基于Hadoop平台,应HBase文件存储系统对海量数据分布式存储以及MapReduce框架进行分布式计算

【作者】

：

孙学波石飞达

【机构】

：

辽宁科技大学软件学院

【出处】

：

计算机工程与设计

【发表日期】

：

2018年1期

【关键词】

：

Apriori算法数据挖掘算法分布式实现 Hadoop平台 Map Reduce框架

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为解决传统数据挖掘算法在大量数据处理时面临的内存占用、计算性能等方面的问题,基于Hadoop平台,应HBase文件存储系统对海量数据分布式存储以及MapReduce框架进行分布式计算,实现Apriori经典数据挖掘算法.通对已实现的Apnon算法进行优化,引入FIS-IS算法思想,从数据库扫描次数和容量消减方向进行改进.提出针对数据身进行频繁预选项生成方法与对于频繁预选项剪枝步骤进行分组检索的优化方法.实验结果验证了改进算法对算法运行有良好的优化效果.

其他文献

我国工伤保险法律制度亟待完善

我国的工伤保险法律制度存在投保人范围过小,并且权威性不强、强制性不足等诸多弊端,这不利于维护劳动者的利益和社会的稳定、和谐.面对我国当前工伤现象层出不穷、愈演愈烈

期刊

工伤保险参保单位保险责任保险经办机构

二自由度平面五杆机构的双曲柄存在条件

首次划分了二自由度平面五杆机构双曲柄存在的充分条件和必要条件。根据格拉肖夫定理推导出二自由度五杆机构的双曲柄存在充分条件；根据装配条件推导了二自由度五杆机构的双曲

期刊

二自由度五杆机构曲柄存在条件

云南自然保护区生态旅游簇群竞争力研究

竞争力是簇群获得持续竞争优势的源泉，云南自然保护区生态旅游品牌竞争力要具有竞争者无法模仿的特性，这不仅取决于它的自然资源特性，也与簇群中相关实体的结盟、协调状态密切相

期刊

供应链自然保护区生态旅游竞争力

基于粒子群算法的最大功率点跟踪方法研究

利用Matlab语言建立了太阳能电池的计算仿真模型,分析了太阳能电池在温度、光强不同时输出最大功率的变化特性。采用粒子群算法对太阳能电池进行了最大功率点跟踪的仿真研究,

期刊

太阳能电池粒子群算法最大功率点

ⅠB期非小细胞肺癌不同亚组的预后研究

目的探讨ⅠB期非小细胞肺癌(NSCLC)不同亚组的预后因素。方法回顾性分析2008年3月至2013年12月间在福建医科大学附属协和医院胸外科接受手术切除的138例ⅠB期NSCLC患者的临床

期刊

癌非小细胞肺肿瘤分期预后

新疆入境旅游市场时空变化及竞争态势分析

新疆具有发展入境旅游独特的地缘优势与资源优势,该文以1999-2010年新疆入境旅游的统计数据为基础,综合运用客源地的地理集中指数、波士顿矩阵理论模型等指标与方法,对新疆入

期刊

入境旅游市场时空变化竞争态势新疆

浅析现代室内设计中美学要素的运用

在室内设计过程当中,要遵循实用、经济的原则,将各种知识进行有机的的结合。现如今,随着时代的进步以及科技的不断发展,人们的生活水平正在不断地提高,对于室内居住的要求也

期刊

室内设计美学应用

科学实践观视阈下思想政治教育路径的传播要素解析

思想政治教育路径即思想政治教育实践的传播主体(教育者)与传播客体(教育对象)借助传播中介(教育讯息、教育媒介和教育反馈)进行主客体双向互动,使传播客体养成良好的思想品

期刊

科学实践观思想政治教育思想政治教育路径传播要素

热处理工艺对Q125级石油套管钢组织和性能的影响

利用扫描电子显微镜(SEM),透射电子显微镜(TEM)和电子背散射衍射技术(EBSD)研究了热处理工艺对Q125级ERW石油套管用钢中组织和性能的影响。结果表明,实验钢采用870℃淬火+500

期刊

热处理Q125ERW回火马氏体

年龄相关性白内障超声乳化术后干眼症的发生与变化

目的探讨白内障术后1-120d内干眼症的发生与变化情况。方法对23例（23只眼）白内障术后1～120d进行定期随访，每只眼均作系统检查，并使用干眼仪检查干眼情况，进行统计学处理。结果白内

期刊

白内障超声乳化泪膜干眼症发生与变化

基于Hadoop的Apriori算法研究与优化

与本文相关的学术论文