论文部分内容阅读
挖掘数据流中频繁项集的技术是当前研究的热点之一.笔者借鉴数据模型FP-tree的结构,提出改进的适应挖掘数据流完全频繁项集的方法:FP-NEW.算法预处理阶段保存生成的潜在频繁项并作为构造NFP-tree中的记录输入,用户可以通过设置时间权重等策略对存储结果进行剪枝处理,最终经过迭代挖掘界标窗口中的完全频繁项集.实验证明算法能够适应数据流频繁项集的挖掘,并且在时空效率以及挖掘准确性上有一定优势.