关联规则算法研究与应用

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:color5188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是当前KDD中的一个重要领域,而关联规则挖掘是数据挖掘的一个重要组成部分。Internet的发展促进了数据库技术的深入应用。由于安全及通信成本、效率等多方面的原因,大量的分散数据不可能集中起来处理。分布式关联规则的挖掘就是在这样的背景下提出的,本文主要研究了如何提高分布式关联规则算法的效率和伸缩性。   本文在分析和介绍了关联规则挖掘的基本概念和方法以及分布式关联规则挖掘方法和技术基础上,提出了中心结点结构的分布式关联规则挖掘的算法(CDA&FP)。同时,分析介绍了基于Web文本集的特征关联规则挖掘框架,详细论述了该框架所涉及到的技术和实现过程中的诸多问题。   Apriori算法是经典的关联规则算法,而该算法在空间和时间的复杂性有着难以克服的局限性。文中介绍了一种不需要产生候选项的频繁模式增长算法,将数据库的事务的信息压缩到FP-tree,然后产生频繁模式,从而避免了多次扫描数据库,降低了时间开销。   对于分布式关联规则挖掘问题,目前的主要算法是CD算法和FDM算法。这些算法都是基于网状结构的分布式关联规则挖掘算法,同时结点都是采用Apriori算法来挖掘局部频繁集,因此在结点通讯量和候选频繁集方面存在不足。本文在FP-Growth算法及FDM算法的基础上,提出以中心结点结构的分布式关联规则挖掘算法,并且从算法分析和实验测试两个方面证明了算法的有效性和可扩展性。
其他文献
随着SIP协议的标准化,该协议成为IP领域内运用广泛的信令控制协议。采用SIP协议开发视频会议系统成为目前的研究热点。这不仅增加了视频会议系统的灵活性、可扩展性,也有利于在
从二维视图重建三维实体是CAD/CAM中的一个关键技术和重要的研究课题。本文针对基于边界表示方法的二维视图重建三维实体重建过程中存在的效率问题展开研究,主要解决了假元判
数字视频水印技术是在原始视频信息中嵌入水印信息来实现版权保护和隐蔽通信。视频水印有基于原始视频的处理算法和基于压缩视频的水印处理算法。在压缩视频中嵌入水印又有两
随着互联网技术、移动通信技术和多媒体技术的蓬勃发展,随着通信领域全新的市场需求和商业模式的出现,人们对未来的通信网络提出了全新的要求,下一代网络(NextGenerationNetwork
最近几年,大规模多处理器系统在计算领域起到了越来越重要的作用。为了解决大型的应用问题必须要求多处理器系统中的每个处理器协同工作。这就要求在处理器之间需要进行数据
自1997年底,“史海泛舟”这一全国首个个人教学网站发布以来,教师个人网站迅速红火起来。个人教学网站以其鲜明的教育特色、健康的内容引来了各方的瞩目。 本文针对目前网络
EPA(EthernetforPlantAutomation)已经作为第十四类型列入现场总线国际标准IEC61158,这极大的促进了基于EPA的各种变送器、执行机构、信号采集模块的设备开发。高效、稳定和高
图像处理是当今计算机科学中最具有前景的领域之一,图像技术有非常广泛的应用。而数学形态学是图像处理中的重要方法之一。数学形态学是建立在集合代数的基础上的,用集合论方法
随着人们对网络多媒体业务需求的不断增加,对等(P2P)传输模式越来越受到人们的关注。采用可伸缩方式对图像编码所得的码流可以适应网络带宽的动态变化,更便于网络传输。但是,可
软件测试作为软件生命周期的一个重要阶段,是保障软件质量的有效手段。软件测试问题的研究越来越引起人们的重视。近年来,工作流软件的开发领域受到了人们的广泛关注,同时也给软