论文部分内容阅读
针对传统挖掘算法会输出大规模频繁子树且其中包含较多冗余信息,使事物表达不够清晰完整,降低后续操作效率的问题,提出基于模式增长的嵌入式频繁子树挖掘算法。定义标签树,并分析挖掘任务,根据模式增长的基本性质,扫描森林数据库,建立与频繁子树模式对应的投影库,确定模式增长过程,设立增长框架。提出融合压缩思想,采用深度优化方式遍历所有子树的节点,构建融合压缩树,实现数据清理。基于数据清理结果组建拓扑序列,制定树与森林的拓扑编码,输入数据库与最小支持度数值,结合覆盖定理对频繁子树队列进行裁剪,完成挖掘。仿真结果表