基于数据分割的几种关联规则采掘算法的探讨

来源 :山东大学 | 被引量 : 0次 | 上传用户:zkhjpaul
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出了三种基于数据分割的关联规则采掘算法:算法PA、算法RP和算法IMA,这三种算法的思想不同,解决问题的方式方法不同,它们分别适用于不同的采掘任务.由于引入数据分割的技术,使得算法可以在分割后得到的块上并行执行,虽然在这种思路下的采掘算法需要协调不同的分割所得出的中间结果,但由于并行的计算可以分别在不同的计算机上进行,这就使得每一分割的规模缩小,相对的可使用内存扩大,对提高算法效率是有很大帮助的.
其他文献
随着计算机技术特别是数据库技术的发展,出现了许多大规模的数据库,而目前还缺乏对其中的数据进行深入分析,找出隐含的规律或知识的有效工具.为了解决这一问题,人们提出了知
嵌入式系统发展迅速,而与之相关的嵌入式软件不仅要满足复杂功能性需求,同时还要满足各种非功能性(时间、功耗、资源、安全、可靠等)需求。开发传统的嵌入式软件,大多数是基
近年业,国内外对KDD的研究开展得如火如荼.决策树是KDD中较早开始进行研究的一种方法.该方法已被广泛的接受并已取得了很大的进展.该文对KDD和决策树进行了比较全面的研究,并
随着移动带宽的发展,特别是3G时代的到来,移动互联网正走向web2.0。以前的大部分的桌面应用现在已可以在手机终端上实现,移动信息搜索、网上购物、移动电邮、在线浏览、高速
该文首先讨论了计算网络可靠性评测指标和研究现状,描述了计算任意K结点(典型为2-terminal)间存在至少一条可靠通路进行通信的概率以及判定给定网络的容错度的一个最常用的有
在三维图形领域,主要包括三维场景建模,三维场景Render和三维场景编辑三方面。特别是在三维场景Render和三维场景编辑方面,实时性、系统性和交互性还存在很大的不足。 基于上
Internet网络的兴起推动了整个世界信息产业的飞速发展,但同时也给网络服务的提供者(ISP)们提出了一个无法回避的问题,即如何保证远程访问的网络安全。 远程访问控制的安全包
该文从流媒体技术的特点出发,研究了流媒体服务器在数据存储、数据I/O、缓冲区管理、访问调度等方面的设计要求;并通过分析目前流行的流媒体服务器的体系结构,总结出了的几种
由于NP难解问题的结构难以被解析的了解,人们常常在算法中引入随机化技术,许多求解NP难解问题的算法都可以看作是随机算法.一般的说,随机算法就是指计算过程受到随机数影响的
并行程序设计环境提供了将自动化编译技术和用户干预相结合的一种手段.在并行程序设计环境中,为了使用户方便而有效地识别串行程序的潜在并行性,我们设计了基于并行编译系统