最大频繁项集挖掘算法综述

来源 :电脑知识与技术·学术交流 | 被引量 : 0次 | 上传用户:wxf19860413
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:关联规则挖掘是近年来数据挖掘领域中一个相当活跃的领域,频繁项集挖掘是关联规则挖掘中最重要的任务。最大频繁项集的规模远远小于频繁项集的规模,通过最大频繁项集可以导出所有的频繁项集,因此进行了很多专门挖掘最大频繁项集的研究。给出了关联规则和相关术语的基本概念,对最大频繁项集挖掘算法作了分析与评价,便于研究者对已有的算法进行改进,提出具有更好性能的新算法。 全文查看链接   3) DepthProject[5]DepthProject算法采用項集的字典顺序树作为概念模型,但对数据库的表示采用的是项集位串(bitstring)。它采用了深度优先(depth first)搜索方法来生成MFI。在挖掘过程中该算法同样采用了超集剪枝和动态记录技术,另外还采用了称为桶计数(bucket counting)的技术来加快项集的频度计数。其实验结果表明,DepthProject算法的性能比Max-Miner算法提高了一个数量级。 全文查看链接   [6] Burdick D, Calimlim M, Flannick J, et al. MAFIA: a maximal frequent itemset algorithm[J]. IEEE Transactions on Knowledge and Data Engineering, 2005, 11:1490-1504. 全文查看链接
其他文献
随着信息技术的快速发展以及人们对信息依赖程度的提高,数据库在整个信息化建设中具有更加重要的作用。如何提高数据库的效率。特别是数据库查询的效率十分关键。论文分别研