一种基于约简模式的频繁项目集挖掘算法

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户：zhifeiji1

【摘要】

：

发现频繁项目集是关联规则挖掘应用中的关键技术和步骤，目前已经提出的可用于发现频繁项目集的算法主要有两大类，一类是Apriori及其改进算法，另一类是基于FP-tree的诸多算法。本

【作者】

：

朱玉全杨鹤标宋余庆陆介平

【机构】

：

江苏大学计算机科学与通信工程学院,江苏,镇江,212013

【出处】

：

第二十一届中国数据库学术会议

【发表日期】

：

2004年期

【关键词】

：

约简模式频繁项目集挖掘算法执行过程挖掘应用设计思想技术难点关联规则关键技术更新算法改进算法二进制位增量式数据库性能实验

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

发现频繁项目集是关联规则挖掘应用中的关键技术和步骤，目前已经提出的可用于发现频繁项目集的算法主要有两大类，一类是Apriori及其改进算法，另一类是基于FP-tree的诸多算法。本文分析了此两类算法的技术难点，提出了一种基于二进制位的数据库约简模式以及基于此约简模式的频繁项目集挖掘算法FIMA，并举例说明了算法FIMA的执行过程，实例和实验结果表明算法FIMA具有较好的性能。另外，本文的设计思想可以方便地应用到频繁项目集的增量式更新算法中去。

其他文献

异构数据集成中包装器Wrapper的设计

本文首先给出一个异构数据集成系统HDIS,HDIS是一个实验性的原型系统，它基于Mediator/Wrapper体系结构，对数据源过滤、通用Wrapper的设计、查询优化和语义冲突消解等问题都给出

会议

一种改进的基于加权平均后验概率的1-层泛化方法

分布式数据挖掘由于在应用上较集中式数据挖掘具有更多的特殊性,如分布的数据源、节点间的通讯等等,都会影响到挖掘的效率.在分类问题的分布式数据挖掘中,不同节点上的分类器

会议

基于分段直方图的时间序列相似度查询

本文提出了一种使用直方图描述时间序列数据、查询时间序列相似度的新方法，与已有的工作相比，本文的方法具有以下优势:1.时间序列分段直方图不仅可以处理全序列匹配.还可以处理

会议

一种基于模糊聚类的日志挖掘方法及应用

本文介绍了一个基于模糊相似关系的聚类方法对Web日志中提取的用户访问URL集进行聚类，同时提出基于模糊理论中的贴近度方法，通过寻找最大贴近度给新进访问用户提供推荐URL序列

会议

XML文档的并行聚类算法

本文提出了基于结构化XML文档的并行聚类算法及两种实现方案，并分别对它们进行了分析.其中所使用的S-GRACE算法是一个可以很好解决查询中数据碎片问题的串行方案，异步通信机制

会议

文档并行聚类算法异步通信机制时间复杂性资源浪费数据开采串行方案结构化计算机分析表硬件选择碎片降价机器查询

脑部医学图像中的关联规则挖掘

随着脑部疾病(尤其是脑瘤)发生率的逐年上升，通过挖掘脑部医学图像来发现知识对辅助医生的诊断变得越来越重要.对于医生来说，确定脑部图像中是否存在可疑的患病区域ROI是很关键

会议

粗糙集在科学数据属性约简中的应用

本文针对科学数据的特点，提出了把粗糙集理论应用于实际的科学数据属性约简的两种方法。基本上解决了决策表的不一致间题，而且提高了计算速度。但Wond等从计算复杂性的角度证明

会议

粗糙集科学数据属性约简计算复杂性最小约简约简算法信息系统理论应用计算速度决策表证明方法

基于遗传算法和K-均值算法相结合的空间聚类分析

空间聚类方法主要有划分方法和层次方法。然而，它们都经常以局部最优结束聚类过程，在实现过程中没有考虑保持群体的全局分布特性，这个缺陷大大限制了其应用范围。遗传算法(Genet

会议

约束性关联规则的在线生成算法

关联规则挖掘是数据挖掘中的一个重要研究方向，关联规则的发现能为决策者提供有用的决策参考.由于决策者往往感兴趣的是关于某些条件的关联规则，即带约束条件的关联规则，从而促

会议

多数据流上共享窗口连接查询的降载策略

本文结合共享滑动窗口查询操作的调度优化方法和降低负载方法,提出了两种在burst环境下提高查询吞吐率的策略，均匀降载策略和小窗口准确降载策略，理论分析和实验结果均证明这两

会议

多数据流共享窗口连接查询策略优化方法理论分析滑动窗口负载方法查询操作小窗口吞吐率证明性能系统实验环境调度

一种基于约简模式的频繁项目集挖掘算法

与本文相关的学术论文