海量数据上挖掘关联规则的并行算法

来源 :哈尔滨工业大学学报 | 被引量 : 0次 | 上传用户:xbmkdx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前关联规则挖掘算法中数据库规模很大时算法执行时间太长的问题.指出了并行计算是解决该问题的一个有效方法.利用新提出的可以忽略仅仅在少于1/4的结点机上的局部频繁项集,给出了一种新的并行随机抽样方法,并利用机群并行计算机的自治能力和I/O高度并行的特点,提高了抽样算法对海量数据的处理能力和效率.理论分析和实验数据显示,该算法的加速比接近于处理机的个数p,通信复杂性为处理机的个数p的对数,具有良好的扩展性和海量处理能力,且精确度较高.
其他文献
《中华人民共和国农民专业合作社法》从今年7月1日起施行。这是我国涉农法制建设中的一件大事,标志着我国农民专业合作社进入了依法发展的新阶段。
随着时代在进步,我国小学的信息技术教学也得到了更高的关注。Scratch是一款面向儿童的简易编程语言,使用简单,不需要通过编写代码即可进行编程。就目前来说,这也是一种最适
腹腔引流术在外科治疗中是一个重要的环节,引流得当,有助于术后的顺利恢复;引流不当,则会造成严重的并发症[1,2].我院近20年腹部手术后引流管所致并发症报道如下.
为及早发现并有效控制大规模爆发的网络安全事件的发生发展,本着主动测量和异常检测相结合的思路,设计实现了大规模网络安全事件协作预警系统,重点探讨了基于聚类算法的宏观
目的:建立复方血褐止痛擦剂的质量标准。方法:采用薄层层析法(TLC)对三七、血褐、苏木进行定性鉴别,应用气相色谱法(GC)对制剂中冰片的含量进行测定。结果:定量分析回收率为99.11%,RSD为
语文是学生学习其他学科和科学的基础,也是一门重要的人文社会学科,更是人们交流思想的工具。所以说培养小学生的语文能力对于小学生以后的发展和成长有着十分重要的积极作用
针对一类二阶动力学系统的分散状态反馈特征结构配置问题,在一定条件下,给出了求解所有状态反馈增益阵和特征向量矩阵的参数化方法,其包含的自由参量为控制系统设计提供了全
慢性充血性心力衰竭(CHF)患者的代偿表现主要是交感神经系统兴奋,神经体液调节异常,肾素-血管紧张素-醛固酮系统(RAAS)激活,致使血管紧张素Ⅱ(AgⅡ)水平升高。这种代偿在早期可
目的:探讨彩色多普勒超声诊断急性阑尾炎的价值。方法:应用彩色多普勒超声加压法探测163例临床拟诊急性阑尾炎者。结果:75例超声提示急性阑尾炎并术后病理证实,其中51例显示急性