论文部分内容阅读
数据流频繁项集挖掘是目前数据挖掘与知识发现领域的热点研究课题,在许多领域有重要应用.然而支持度阈值的设定需要一定的领域知识,设置不当会给后续的分析处理带来很多困难和不必要的负担,因此挖掘数据流top—K频繁项集有重要意义.提出一个挖掘数据流界标窗口top—K频繁项集的动态增量近似算法TOPSIL—Miner,为此设计了存储流数据摘要信息的概要结构TOPSIL—Tree以及动态记录挖掘相关信息的树层最大支持度表MaxSL、项目序表0IL,ToPSET和最小支持度表MinSL等,并分析了与这些概要结构相关的挖