分布环境中的并行频繁模式挖掘算法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:zyu03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频繁模式的并行挖掘算法是数据挖掘中重要的研究课题。目前已经提出的并行算法大多是基于Apriori或基于FP—tree。由于两者的固有局限性,而且在计算过程中需要多次同步,因而具有较低的性能。文章提出了一种基于分布数据库的并行挖掘算法。该算法尽可能地让每个处理器独立地挖掘,每个处理器基于前缀树采用深度优先搜索的策略挖掘局部频繁模式集,并通过相关性质尽量减少候选全局频繁模式的规模,减少网络的通信量和同步次数以提高挖掘效率。
其他文献
目的儿童十二指肠溃疡临床表现常不典型,常因并发出血就诊,为探讨儿童十二指肠溃疡并出血的有效治疗方法,该文采用立止血联合洛赛克治疗并观察其疗效.方法38例患儿随机分为治
文章[1]中提出了数组之间的数据融合优化方法,并以IA-32服务器为平台测试了数据融合优化的效果。测试结果表明,在IA-32机器上,数据融合优化在性能代价模型的控制下,能较好地改善
一、原因何在影响师专学生课堂学习积极性的因素很多,导致学生学习积极性低落的原因,概括起来主要有以下几个方面:
7月2日,富土施乐株式会社正式宣布.2007财年,富士施乐在日本及亚太地区运营的整合资源循环系统成功削减使用新资源3860吨.降低CO2排放达2.5万吨。在这一年中.富士施乐减少了全新零
【正】 农业用地的地力建设问题,实质上就是一个农田生态经济问题。这个问题,过去几年未曾引起人门重视,成为被人们遗忘的角落。然而,事物发展矛盾运动的内在规律性并不依人
14天的精彩绽放,drupa2008带来了印刷业新的技术走向风向标,数不胜数的技术创新以及新的商业应用让人应接不暇,而其中最大看点的“喷墨印刷”专题展示不负众望,成为本届展览会上
【正】 我省森林总蓄积高达13.2亿立方米,在全国占第三位,是一大优势。但是,长期以来,这一优势却未能发挥应有的作用。由于种种原因,还使优势有减弱甚至消失的危险。如每年消
【正】 党的十一届三中全会是建国以来党的历史的伟大转折点。几年来,党中央尊重亿万农民的实践经验,倾听亿万农民的呼声,制定了一系列切合我国实际的搞活农村经济的政策措施
【正】 胶茶群落为巴西橡胶(乔木)与云南大叶茶(灌木)所组成。这种双层空间结构的人工植物群落,对小气候有明显的影响,它改变了太阳辐射空间分布、空气流动、以及生物小环境
目的探讨急相蛋白(APP)在支原体肺炎(MPP)时水平变化及治疗中的价值.方法检测30例MPP急性期和19例恢复期患儿血清C反应蛋白(CRP)、α1酸性糖蛋白(α1-AGP)、触珠蛋白(HP)和铜