一种基于MapReduce架构的并行矩阵Apriori算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:theonezhaoq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统数据挖掘关联规则Apriori算法直接移植到云计算平台,数据挖掘效率虽然有了数量级的提升,但由于需要频繁地扫描事务数据库,增加了系统I/O、内存和通信的开销。提出一种基于矩阵的并行关联规则算法Apriori_MMR,该算法结合了数据划分的思想进行并行化改进,简化了生成候选项的连接步骤,仅需对事务数据库扫描两次,同时在计算过程中还能对事务进行压缩从而进一步提高了算法的性能。通过两种算法在不同数据规模下算法性能对比分析实验和两种算法在相同数据集不同节点数对比实验,共同验证了Apriori_MMR的运算效率
其他文献
目的:探讨应用显微外科技术行输卵管复通术的效果及影响妊娠的因素。方法:对我站1989年4月~1998年5月,应用显微外科技术行输卵管复通术49例进行随访研究,并对复通患者年龄、绝育期
在统计机器翻译中融入有价值的句法层面的语言学知识,对于推动统计机器翻译的发展具有重要的理论意义和应用价值。提出了三种由简到繁的将双语最大名词短语融入到统计翻译模型的策略,整体翻译性能逐步上升。Method-Ⅲ采用分而治之的策略,以硬约束的方式在统计机器翻译中融入最大名词短语,并在双语最大名词短语层面上融合了短语翻译模型和层次短语模型,对翻译系统的改善最显著。所述策略显著提高了短语翻译模型的质量,在
向量寄存器的非满载使用方式为大量迭代次数不足的循环提供了向量化的机会,但也导致向量化的并行宽度不固定,传统的向量因子主导的依赖测试方法不再适用。提出了一种依赖距离主导的依赖测试方法,通过分析依赖图中所有依赖环的破环关键边所携带的依赖距离,选择其中最小的依赖距离来决定并行宽度,破除依赖环,实现基于向量寄存器非满载使用方式的向量化。实验结果表明,该方法能够有效增加循环向量化的机会和提高向量寄存器的使用
(本文所用主要缩写:CSS:变应性肉芽肿病,WG:Wegener's肉芽肿病,ANCA:抗中性粒细胞胞浆抗体,PDGF:血小板衍生生长因子,PBMC:外周血单核细胞,TGF-β:转移生长因子β,PR3:蛋
脂肪栓塞综合症是发生在严重创伤,特别是长管状骨骨折后的严重并发症之一.以呼吸困难、神经系统症状、发热及皮肤粘膜出血点为主要临床表现.据文献报导,严重创伤后肺部的脂肪
目的:探讨X刀治疗颅内肿瘤、脑血管畸形的方法与疗效.方法:X刀治疗颅内肿瘤、血管畸形302例,单次治疗219例,分次83例.结果:平均随访16.36月,1年生存率87.35%,平均生存期21.69
1 病历报告患者,男性,14岁.因腹痛、头痛、烦躁不安4天入院.患者4天前烹食400g蚌壳肉后约4小时出现阵发生腹部绞痛,持续性头痛伴唾液增多,时有四肢小抖动,但意识清楚.
腹股沟疝是普外常见疾病,男性和女性一生中发生疝的机会分别有25%,2%[1],其中主要为腹股沟疝.Bassini等传统的疝修补手术约有10%的复发率,尽管现代的Lichtenstein,Stoppa技术
发射队列是处理器流水线的关键结构。降低发射队列对软错误的敏感性已成为微处理器可靠性设计不可忽视的问题。提出一种在处理器流水线前端实施的软错误脆弱性控制方法,该方法在不改变功能单元的情况下,根据指令流混合比与功能单元配置的匹配情况,调节发射队列中的指令类型比例,降低指令在发射队列中的等待时间,从而降低发射队列的体系结构脆弱因子,缓解软错误敏感性。实验结果表明,该方法平均减低发射队列的架构易感因子2.