基于FP树和对称矩阵的最大频繁模式挖掘算法

来源 :第二十五届中国数据库学术会议(NDBC2008) | 被引量 : 0次 | 上传用户:aaalxf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
FP-Max算法是一种有效的最大频繁模式挖掘算法,但它在挖掘过程中产生的候选集规模过大,需要构造和遍历大量没必要的条件FP树,因此效率低。为此提出了SMFP-Max算法,算法以FP树和对称矩阵为框架来挖掘最大频繁模式,在挖掘过程中采用了多种剪枝策略并结合自顶向下和自底向上的双向搜索策略,大大缩小了候选集规模,避免了不必要的条件FP树的产生.理论分析和实验结果表明,SMFP-Max算法是一种高效的最大频繁模式挖掘算法,具有良好的时空效率,算法性能优于FP-Max算法。
其他文献
随着无线mesh网络的迅速发展和实时多媒体业务的日益增长,要求无线网络不仅能提供简单的连通性,还需要提供非常有效的QoS保证机制,针对这一问题,以时分多址/时分双工(TDMA/TD
会议
在网络入侵检测中,大量的特征增加了算法在时间和空间上的消耗,其中不相关或冗余的特征还可能导致检测精度下降.针对这个问题,提出了一种面向网络入侵检测的特征选择方法。该
会议
本文在波束成型理论的基础上研究MIMO-OFDM系统自适应资源分配算法,在保证给定的误比特率和信息速率下,使总的发射功率最小为目标,借助遗传算法来推导的一种新多用户MIMO-OFD
关系数据库通常含有大量的数据,冗余很少,且经常需要一些例行的操作.因此,传统的多媒体水印技术无法直接应用于关系数据库.目前大多数数据库水印采用的都是空域方法,如何找到
会议
寻找DNA序列中的重复片段是DNA序列挖掘中的一项重要的研究内容,它是基因分析的一个重要问题。通常的方法采用特定的索引结构如后缀树、后继数组等,算法效率有待提高.提出一
提出了一种GML文档结构聚类新算法MFPBCLU,以GML文档中的路径表示GML文档结构,挖掘所有GML文档路径中的最大频繁路径,以GML文档包含的最大频繁路径为特征进行GML文档结构聚类
异常点检测是数据挖掘领域中的重要研究方向,但传统的异常点检测算法存在许多不足,比如缺乏用户的导向和控制,在挖掘之前就确定了挖掘空间,不能动态地根据中间挖掘结果选取挖
会议
卫星电视直播,是指利用地球同步卫星的转发器向服务区发送电视广播信号,供地面用户进行个体接收或集体接收的业务。DTH必将引起涉及全球的电视业的一次革命。基于此,论述了卫
为在海量离群轨迹数据的挖掘中提升算法运行效率,提出一种高效的离群轨迹挖掘算法TRAODGrid.该算法通过挖掘离群轨迹点探测离群轨迹.轨迹向量度量方法可以有效检测出轨迹点和
会议
把基于GEP的数据函数发现算法(DFF-GEP)应用于多数据流的压缩,做了如下工作:1)对基于GEP的数据函数发现算法进行了介绍,并对多数据流的基本概念给出定义并揭示出其中存在映射
会议