【摘 要】
:
传统的基于频繁模式增长的并行关联规则算法在处理动态更新的数据集时,需要把更新后的数据集全部压缩到频繁模式树中,消耗了大量时间和存储空间,且没有充分考虑头表分组过程
【基金项目】
:
江苏省自然科学青年基金(BK20150861)
论文部分内容阅读
传统的基于频繁模式增长的并行关联规则算法在处理动态更新的数据集时,需要把更新后的数据集全部压缩到频繁模式树中,消耗了大量时间和存储空间,且没有充分考虑头表分组过程中组间负载量不同的问题。针对在关联规则的实际挖掘过程中,数据集快速增长所造成的增量更新问题,基于并行频繁模式增长PFP-tree算法,结合Spark分布式并行处理框架,提出一种改进的并行关联规则增量更新算法。在增量更新过程中,为了减少挖掘时间和存储空间,利用已有挖掘结果对新增数据集构建频繁模式树。通过改进头表分组策略,实现了并行挖掘节点之间的负载
其他文献
过度训练综合征(OT)是一种由于过度训练导致大脑皮层兴奋与抑制过程的不协调和内分泌调节的功能障碍,身体会产生一系列功能上甚至病理上的改变。可以寻找其潜在的负荷和内外
近年来,随着中美贸易顺差问题的不断凸显,外商投资企业在中美贸易顺差中的影响和作用也受到关注。经分析发现,贸易逆差转移效应和贸易替代效应的发生是外商在华直接投资导致
从地勘工作的发展大势看,长期靠地质勘查资质来封闭市场不利于激发勘查市场主体的活力,不便于与国际勘查市场接轨,甚至不能本质性地调动找矿人的积极性。在国家地勘行业管理部门
着重从“邪之所凑,其气必虚”,“久病多虚”等方面阐述正虚邪实是子宫肌瘤的主要病机,并提出“扶正祛邪、祛瘀散结、调摄冲任”为其治疗大法。
解决物理问题的关键是深刻地理解物理现象,牢固地掌握物理规律和定律,并能熟练地运用数学知识解 决相关的物理问题.
目的了解帕金森病小鼠模型黑质和纹状体中差异表达的基因以及在MPTP作用后不同时间点基因表达变化的规律。方法取16只SPF级C57BL/6J小鼠,用数字表法随机分为2组。MPTP组:30mg
<正>学习知识是为了应用知识,领会了知识的应用价值,才能更好地促进学生学习知识。数学应用题的教学是一个重点,也是一个难点。所以在教学过程中,教师应从学生身边的实例开始
将K-ε湍流模式引入水库水温与水质的垂向二维分布规律研究中,考虑它们之间固有的交互作用,建立了水库垂直二维湍流与水温水质耦合模型。文中采用了微分方程坐标变换技术,数值格式
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield