基于MapReduce的频繁闭项集挖掘算法改进

来源 :微型机与应用 | 被引量 : 0次 | 上传用户:sun8888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
挖掘频繁闭项集(CFI)在许多实际应用中起着重要的作用。传统的数据挖掘算法中常用FP增长算法和Apriori算法来挖掘频繁项集。然而,内存需求和计算成本成为CFI挖掘算法的瓶颈,尤其是在从大型数据集中挖掘频繁闭项集时,是一个重要和具有挑战性的问题。针对上述问题,提出一种基于云计算的MapReduce框架的并行AFOPT-close算法,使MapReduce可广泛地用于处理大型数据。此外,用于检查频繁项集是否为完全闭的有效并行算法也要求MapReduce平台进一步完善其性能。
其他文献
大数据是一把双刃剑,给我国地方政府治理带来重要机遇:提升公共服务能力、提升科学决策能力、提升精细化社会治理能力、提升公共危机管理能力等,但同时也带来了不少挑战:大数
在看到过往努力所取得的巨大成就的同时,上海作为我国国际化程度最高的金融中心,在打造全球有影响力的科创中心过程中,可以按照国家要求,站高一层、领先一步,继续主动对标国际最高
报纸
【正】 科学技术是生产力,其重要性已经越来越被人们所认识。作为记载科学技术存在的表现形式和储备形式,以及作为反映科学技术思想和发展状况的科学技术档案,是不是生产力?
提出采用IP2202MCU、基于88W8686SoC芯片的Wi—Fi模块和H9918EVDO3G模块的组合,构建无线双模VolP语音网关,实现语音通信的低成本、低功耗和机动灵活性。
新丰江、枫树坝和白盆珠3座大型水库的建立对东江流域河道流量和河流流态过程有了较大改变,威胁河道下游生态系统的健康。基于广义指标生态剩余和生态赤字评价了东江流域受水
根据国家统计局的安排,2007年天津开展联网直报试点工作,将联网直报的范围由大中型工业企业扩大到全部规模以上工业企业。在当前的条件下扩大联网直报范围,虽然会面临许多问题和
<正>一八八九年,当举世瞩目的埃菲尔铁塔在塞纳河畔绽放异彩,并逐渐成为巴黎的地标性建筑之时,就在河对岸,出现了一座以展示亚洲艺术藏品为主的博物馆——吉美博物馆。建立之
“说课”作为起源于中小学教学改革的教研形式现在逐渐被许多高等院校所应用。“说课”可以改进和优化备课,改善课堂教学,提高教学质量。由说课构成的教研循环对课堂教学质量
【正】 静电复印机的种类、样式以及大小各有不同,但是复印过程大体都是经过充电、曝光、显影、转印、定影和清洁等步骤来完成(如图3—1)。
M普朗克确信,外部世界是独立于人类感觉的"绝对的东西”,它可以被人类的智慧所认识.在这种信念下,他始终将能量和熵的本质问题作为研究的中心.当普朗克研究黑体辐射问题时,再