一种基于约简模式的频繁项目集挖掘算法

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户:zhifeiji1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
发现频繁项目集是关联规则挖掘应用中的关键技术和步骤,目前已经提出的可用于发现频繁项目集的算法主要有两大类,一类是Apriori及其改进算法,另一类是基于FP-tree的诸多算法。本文分析了此两类算法的技术难点,提出了一种基于二进制位的数据库约简模式以及基于此约简模式的频繁项目集挖掘算法FIMA,并举例说明了算法FIMA的执行过程,实例和实验结果表明算法FIMA具有较好的性能。另外,本文的设计思想可以方便地应用到频繁项目集的增量式更新算法中去。
其他文献
本文首先给出一个异构数据集成系统HDIS,HDIS是一个实验性的原型系统,它基于Mediator/Wrapper体系结构,对数据源过滤、通用Wrapper的设计、查询优化和语义冲突消解等问题都给出
会议
分布式数据挖掘由于在应用上较集中式数据挖掘具有更多的特殊性,如分布的数据源、节点间的通讯等等,都会影响到挖掘的效率.在分类问题的分布式数据挖掘中,不同节点上的分类器
会议
本文提出了一种使用直方图描述时间序列数据、查询时间序列相似度的新方法,与已有的工作相比,本文的方法具有以下优势:1.时间序列分段直方图不仅可以处理全序列匹配.还可以处理
会议
本文介绍了一个基于模糊相似关系的聚类方法对Web日志中提取的用户访问URL集进行聚类,同时提出基于模糊理论中的贴近度方法,通过寻找最大贴近度给新进访问用户提供推荐URL序列
会议
本文提出了基于结构化XML文档的并行聚类算法及两种实现方案,并分别对它们进行了分析.其中所使用的S-GRACE算法是一个可以很好解决查询中数据碎片问题的串行方案,异步通信机制
随着脑部疾病(尤其是脑瘤)发生率的逐年上升,通过挖掘脑部医学图像来发现知识对辅助医生的诊断变得越来越重要.对于医生来说,确定脑部图像中是否存在可疑的患病区域ROI是很关键
会议
本文针对科学数据的特点,提出了把粗糙集理论应用于实际的科学数据属性约简的两种方法。基本上解决了决策表的不一致间题,而且提高了计算速度。但Wond等从计算复杂性的角度证明
空间聚类方法主要有划分方法和层次方法。然而,它们都经常以局部最优结束聚类过程,在实现过程中没有考虑保持群体的全局分布特性,这个缺陷大大限制了其应用范围。遗传算法(Genet
会议
关联规则挖掘是数据挖掘中的一个重要研究方向,关联规则的发现能为决策者提供有用的决策参考.由于决策者往往感兴趣的是关于某些条件的关联规则,即带约束条件的关联规则,从而促
会议
本文结合共享滑动窗口查询操作的调度优化方法和降低负载方法,提出了两种在burst环境下提高查询吞吐率的策略,均匀降载策略和小窗口准确降载策略,理论分析和实验结果均证明这两