论文部分内容阅读
分析了目前众多的Apori算法的改进算法,指出其不完备性,提出了一种事务的二元组表示法,该二元组直接用字段的值串和串的出现次数来替换原始事务数据库,并在此基础上进行扫描,该表示法所占内存大小只取决于数据库的基,而与数据库的大小无关,整个过程只进行一次数据库扫描,其它工作都在内存中完成,在数据库的基较小时,表现出良好的性能。同时,定义了一种基于该二元组表示法的索引结构来表示频繁项集,该方案占用内存少,速度快。