基于频繁模式树的FP-GROWTH算法的改进研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:proudboy_linux_wzh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  FP-growth是一个经典的频集算法。FP-树的建立是这个算法中非常关键的一步。因此,其建树算法的效率对整个挖掘算法至关重要。本文从Fp-树的建树过程入手,分析其不足,并考虑相应的改进方法。首先是针对FP-树的建立过程中,每新增一个节点项都需要沿着link_list查找最后一个节点,过程比较繁琐,因此考虑在头表节点的数据结构中加入一个tail指针,直接指向最后一个节点,节省了查找时间;其次是针对原算法的查找过程中,需要将新增项与原节点一个一个比较,影响了算法的效率,故考虑建立一个hash表,通过一个hash函数,直接将新增项定位,省去了比较的时间。最后是考虑将两个改进方法综合起来,结合两者的优点,进一步优化算法。文中最后通过实验来分析比较改进前后的算法性能,并提出还有待改进的新的研究方向。
其他文献
犹豫模糊语言术语集能够灵活、全面地反映决策者的定性决策信息,在供应链管理、模式识别和医疗诊断等领域具有广泛的应用前景,已成为模糊集理论研究中的热点.熵是用来衡量模糊
流体动力学方程组作为一种描述物质运动的宏观模型,是我们认识与理解自然现象的一类非常重要的非线性偏微分方程组,它一直占据着数学物理学界的核心研究领域.本文重点研究非齐
本文研究了调和AN群上的Kunze-Stein现象,主要证明了下面的端点估计: 若S=A×N,其中A≌R+*,N为Heisenberg型群,则有 L2,1(S)*L2,1(S)#()L2,∞(S). 由该结果和多线性插值定理
Delaunay三角剖分作为处理空间中实体聚类分析中的有效技术之一,本文将其引入并将MTSP问题限制在二维欧式平面内结合最小支撑树和双生成树算法思想,从而得到树分解算法。通过
图像放大是图像处理中的一个分支领域,它是由一幅低分辨率的图像得到其高分辨率的图像.图像放大是一种重要的图像处理技术,在现实生活中具有重要的作用,例如在医学照相、卫星
本文首先从价格角度提出了以风险对收益的弹性系数为风险偏好系数θ且含无风险证券的风险偏好模型。利用K ? T条件和风险中性概率两种方法求解,较之已有模型,同样解决了Marko
本文主要研究平均曲率流的一些性质和相关问题.主要内容包括:球面中平行平均曲率子流形在数量曲率拼挤条件下的刚性定理;局部对称空间中平行平均曲率子流形的刚性定理;平均曲
本文通过构建混合单调算子中新的不动点定理,给出下列积分方程  x(t)=∫tt-τ(t)[f(x,x(s))+g((s,x(s)))]ds,  x(t)=∫t-∞a(t-s)[f(s,x(s))+g((s,x(s))]ds,概周期型解的
本文参照C.W.Onnewwer 1977-1980年在二进群(域)及局部域上定义导数的方法[1]-[4],给出了α进群上的分数阶导数和积分的定义。据此定义,a进群的特征恰是微分算子的特征函数,并且特征值
网络可靠性一直是衡量网络性能的重要指标,其重要性反映在网络规划、维护策略等方面。基于可靠性定义的期望路径表示网络中所有s-t路径长度的数学期望值。利用期望路径来分析