基于压缩FP-树和数组技术的频繁模式挖掘算法

来源 :2007全国理论计算机科学学术年会 | 被引量 : 0次 | 上传用户:kuofa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
FP-growth算法是目前较高效的频繁模式挖掘算法之一.它只需扫描数据库两次,而且不需要产生和测试候选集,避免了这些费时的工作,因此该算法具有较高的效率.然而,FP-growth算法需要递归地生成大量的条件FP-树,这耗费了大量的存储空间和时间.综合已有的几项优势技术,提出了一种频繁模式挖掘算法CFPmine. 一是采用了基于压缩FP-树的约束子树的挖掘方法,避免在挖掘过程中生成条件FP-树,减少内存占用;二是采用基于数组的技术,减少FP-树的遍历时间,提高算法的效率.另外,在算法中还实现了统一的内存管理.实验结果表明,CFPmine是一个高效的频繁模式挖掘算法,其性能优于Apriori,Eclat和FP-growth算法,而需要的内存却少于FP-growth算法.
其他文献
冲击波SM-102拥有2个醒目的大眼睛,给人印象很独特。这款产品中频饱满,声音洪亮,可大音量播放,也能轻松提升笔记本电脑的音质水平。 Blast SM-102 has two eye-catching eye
针对传统基于二阶统计量的循环平稳信号处理方法不能有效处理脉冲噪声干扰的问题,提出了一种基于循环多核相关熵的故障检测方法.首先,给出了多核相关熵的定义,推导了循环多核
提出了袋自动机模型和袋语言的概念,并给出了袋自动机的状态转换图;分析了袋语言重复序列在状态转换图中的反映,并划分为不变重复序列、增重复序列、减重复序列和传递重复序列
针对轴承圆柱滚子直径快速测量时,传感器触头与滚子接触产生的作用力导致其变形影响精度这一问题,提出了一种考虑微观变形的接触动力学模型的研究方法.该方法基于Hertz接触理
为研究氧连接N-乙酰葡萄糖胺(O-linked N-acetylglucosamine,O-GlcNAc)糖基化修饰调控人绒毛膜癌细胞(JAR)迁移的分子机制,首先采用siRNA和酶特异性抑制剂作用细胞,构建O-Glc
针对RAID在线扩展系统这一典型的存储系统混合负载访问问题,采用多类顾客闭合排队网络(multi-customer closed queueing network, MCQN)对系统建立性能评价模型.推广了平均值
会议
针对磁电编码器角度值易受到高频噪声影响,影响角度值输出精度问题,提出了一种基于卡尔曼滤波器及运动状态方程角度值误差主动监督补偿方法.为了降低角度值观测噪声,采用基于
麦博MD126这款音箱拥有纤巧的soundbar体型,一体化设计的造型,简约大方的外观,精美细致的工艺,很适合摆放在桌面上且不会占用太多空间。作为一款主打音质牌的新品,麦博MD126
解放军264医院来青峰等认为,部队医院野战医疗所的传统管理模式曾对部队卫勤保障工作做出过重大贡献,但在新形势下,这种管理模式使储存的战备物资长期闲置,造成卫生资源大量浪费
提出了一种基于纸基底的喷墨印刷无芯片RFID湿度传感器,通过遗传算法与射频仿真软件HFSS相结合,对常规开口环谐振器结构进行分布式加载,得到目标频率为2.45 GHz的谐振特性良