分布式频繁项集挖掘算法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:dwj854
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的频繁项集挖掘方法具有一定的局限性。Apriori算法需要重复扫描输入数据,导致很高的I/O负载,算法性能不高;Fp-growth算法需要在内存中建立Fp-tree并根据Fp-tree挖掘频繁项集,导致算法受到计算机的内存限制。在大数据时代,由于挖掘数据规模十分巨大,更加凸显这些传统算法的局限性。对此,一方面改进传统的频繁项集挖掘算法,另一方面基于Spark框架实现分布式频繁项集挖掘算法(FIMBS)。实验结果表明,该算法相比基于MapReduce框架的关联规则算法具有显著的优势。
其他文献
随着信息技术的迅猛发展及其在社会各个领域中得到广泛应用,信息素养已成为现代社会中人的整体素质的重要组成部分,并已经成为当今社会创新型人才的必备素质之一。因而,信息素养
随着改革开放的深入和国民经济的发展,军人财产的种类和数量不断增多,在军人遇到的涉法问题中,财产纠纷所占比重越来越大,有关军人财产归属或分割问题也逐渐成为官兵关注的热
为了实现联合国卫生组织提出的到公元20O0年时人人享有卫生保健的要求,根据笔者多年亲身体验,认识到普及气功科学,发展第四医学是落实全民健身计划尽早达标的必由之路。一、第四
为了解决锚节点分布不均匀时质心定位算法会产生较大误差这一问题,提出一种改进的质心定位算法。用初次质心定位结果来取代未知节点通信半径内距未知节点最远的信标节点,再进行二次定位来减小由于信标节点分布不均匀而导致未知节点的估计位置偏向距离较远的信标节点的现象。仿真结果表明,相比传统的一次质心定位算法,二次质心定位算法在定位精度方面有较大的提高。
基于正态分布、学生-t分布、GED分布和Skewed-t分布四种不同分布,采用ARFIMA-FIGARCH模型对深圳股市收益率的风险值进行了动态建模。通过模型实证参数估计,发现深圳股市收益
摘要:经济全球化的深入和发展,使能源安全成了人们普遍关注的一个社会热点问题。美国、日本、中国和印度作为重要的石油消费和进口大国,在寻求能源方面存在竞争的现实,但也存在合作的机遇。石油进口大国合作有利于抑制过高的油价,可以避免国际能源市场上的恶性竞争,有利于维护世界和平。建立石油进口国组织,共同参与海外油气开发和管道建设以及在节能环保领域开展合作是合作的主要途径。  关键词:石油进口大国;能源安全;
目的:观察自拟滋肝补肾方治疗恢复期脑梗死疗效。方法将100例恢复期脑梗死患者随机分两组各50例,治疗组采用滋肝补肾方治疗,对照组采用血栓通注射液治疗,疗程均为15d。观察两组临
《中国气功科学》编辑部:看了贵刊第五期刊登的关于拙作《好人·琴人·奇人》后面联系地址、联系人的“重要更正”后,深感慰藉和激动,不禁为贵刊此举而大声叫好!一好在闻
将新疆生物质能资源分为四类:农作物资源、薪柴资源、人畜粪便资源、城市生活垃圾资源,并对新疆生物质能资源总量进行估算。表明储量巨大,新疆生物质能资源总量26 850.832万吨
原张仲景国医大学”教授郭炳宇经过数十年艰苦卓绝的探索,发明了一种“量子水药”,医治各种疑难病,疗效甚佳,患者争相购买。郭炳宇教授认为,当代人类对物质世界的认识,已深人到粒子