基于Spark的并行频繁模式挖掘算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:pingwuse
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据环境下Apriori频繁模式挖掘算法在数据处理过程具有预先设定最小阈值、时间复杂度高等缺陷,为此采用多阶段挖掘策略实现并行化频繁模式挖掘算法PTFP-Apriori。首先将预处理数据以模式树的形式存储,通过最为频繁的k个模式得到最优阈值。然后根据该值删除预期不能成长为频繁的模式以降低计算规模,并利用弹性分布式数据集RDD完成统计项集支持度计数、候选项集生成的工作。实验分析表明相比于传统的频繁模式挖掘算法,该算法具有更高的效率以及可扩展性。
其他文献
数学教学应该发展学生自主学习数学的能力,让其自"悟"自"得"。但是,在实际数学教学过程中,学生的自悟并不容易,经过实践,笔者总结出"有情境,有指向,有程序"的"三有"教学策略,
夏季天气阴晴交替冷热不定,不稳定的天气会使人体脾胃内虚,抵抗力下降,夏日炎炎出汗增多,脾胃受外界湿热影响,消化及吸收的功能减弱,因而会感到全身无力,胃口欠佳,口淡乏味。
目的:(1)了解慢性阻塞性肺病(COPD)发病机理中气道炎症的特点;(2)研究细胞因子在慢性气道炎症中的作用;(3)探讨红霉素对COPD气道炎症的防治作用及其作用机理。 方法:(1)将动物
<正> 消渴病(糖尿病)以三多(多饮、多食、多尿)两少(体力减少、体重减少)为其主证.然而,由于消渴病的病程长、延伸日久,损及的脏腑之多,併发症之广,病情的错综复杂之最,病理
<正>手卫生是预防医院感染,最重要、简便、经济和有效的方法,因此受到世界卫生组织(WHO)的高度关注。医院环境中存在大量微生物,且现代医院临床介入性检查和操作较多,医护人
会议
党内谈话制度是一种重在防患于未然的思想政治工作形式,它是在发现苗头性、倾向性问题或轻微违纪问题时,通过与谈话对象的沟通交流、批评教育,引导其认识问题、转变思想、改
随着我国经济快速发展,人们的消费水平日益提高。因此,人们对于家居产品的要求不仅仅再是物美价廉,而有更加深层次的需求,那就是情感需求。尤其是女性消费者在消费者中所占比
1.概述液压支架是煤矿综合机械化采煤工作面的重要支护设备,其主要组成部分有底座、顶梁、掩护梁及液压缸等,
目的探讨微阵列酶联免疫法(Array-ELISA)检测肿瘤标志物对胃癌的诊断及术后疗效观察上的应用价值。方法采用Array-ELISA同时对28例胃癌术前患者、37例胃癌术后患者(其中10例
上海氯碱化工股份有限公司是中国最大的氯碱产品制造和供应商,经营实力处于国内领先地位。1991年取得自营进出口权,1992年被国家认定为特大型企业,公司科研机构为国家级技术