FP-树相关论文
从大型数据库中挖掘关联规则是数据挖掘领域中非常重要的研究课题。其中,最大频繁模式挖掘问题在关联规则挖掘任务中扮演着重要的角......
该论文对基于短消息业务的数据挖掘系统的子系统短消息业务相关性分析系统进行了研究与实现.该论文首先分析设计了基于短消息业务......
数据挖掘技术可以从数据仓库中的历史数据里提取出有价值的信息。关联规则数据挖掘是其中一个重要研究方向,挖掘的关键是选取恰当的......
随着数据库技术的飞速发展以及数据库管理系统的广泛应用,各个企业和部门通过自己的数据库管理系统,经过长年努力,已经积累了越来越多......
数据挖掘的任务是发现大型数据集中隐藏的、预先未知的知识。关联规则的挖掘是数据挖掘研究的重要问题之一。该问题自1993年被R.Agr......
随着信息产业的发展,人们获取数据和知识的手段已趋向于多样化。人类拥有的数据量越来越庞大,在这些数据量的背后可能隐藏着大量我......
FP-growth是一个经典的频集算法。FP-树的建立是这个算法中非常关键的一步。因此,其建树算法的效率对整个挖掘算法至关重要。本......
学位
不同数据集中数据的不同分布特征,对于频繁模式挖掘算法往往有着较大影响。将不同的现有算法结合起来,根据数据集的不同特性采用不......
加权频繁项目集获取是加权关联规则发现问题的关键。本文在考虑项目权重的前提下,以FP树的形式组织交易数据,提出了基于加权项目的......
提出一种基于静态IS-树的频繁模式挖掘有效算法IS-mine,并与经典的Apriori算法和FP-growth算法进行了实验比较。算法直接构造频繁......
为了实现烟草病害准确预测和科学防治,提高烟草生产的质量,利用现代计算机技术、人工智能技术、数据库及数据挖掘技术实现了一个基......
随着数据库规模的增加或支持度阈值的减少,频繁模式的数量将以指数形式增长,FP-growth算法运行的时空效率将大为降低.本文提出一种......
缺陷关联使得目前的缺陷定位方法面临着严峻挑战,为了快速准确定位软件缺陷,保证软件产品质量,对定位方法的改进势在必行。基于函数调......
典型协会规则考虑仅仅在交易枚举的项目。如此的规则被叫作积极协会规则,否定协会规则也考虑一样的项目,但是另外考虑项目否定(我。e......
针对分布式环境下FP-tree的构造及合并,给出了一种网格环境下FP-tree的分布式构造算法GridDBMA。该算法中,各站点根据全局项目头表......
关联规则挖掘是数据挖掘领域的一个热点。Apriori算法作为进行关联规则挖掘的一种重要算法,其应用范围相当广泛。但用传统的Aprior......
文章针对快速挖掘模糊频繁项集问题,提出了一个基于fp-树的快速算法FFP,该算法提高了快速挖掘模糊频繁项集的时空效率.实验表明,该......
就数据挖掘中关联规则的概念和作用进行了探讨,对关联规则中寻找大项集的关键算法作出了剖析,提出了一种关联规则经典Apriori算法的......
提出一种基于FP-树的时空关联规则挖掘算法,即STFP—tree(Spatio—temporalFP—tree)算法.算法对时空数据进行时间上的划分,并用空间谓......
关联规则的挖掘大都在用户设置的支持度阈值的限制条件下,产生频繁项目集合。得到关联规则。但是没有相关领域的专门知识,用户很难设......
传统的频繁模式挖掘算法往往会得到成百上千的结果模式,面对繁多的频繁模式用户通常要经过“二次挖掘”才能得到有用的目标模式。怎......
文章针对挖掘最大频繁项目集问题,提出了一个基于FP-树的快速算法DMFP,该算法引入了FP-树最大深度和非频繁2-项集,采用自顶向下和自底......
针对生物网络中频繁子图的挖掘问题,提出了一种基于EP-树结构的MaxFP算法。此算法以代谢路径作为研究对象,在适合于生物网络图简化模......
由于挖掘密集型数据的频繁模式完全集非常困难,因而改进了传统的FP-树结构并提出了一种基于改进FP-树的最大频繁模式挖掘算法IFP-M......
在由频繁项集产生关联规则时,利用提升度判断规则前、后件之间的正相关性可以避免产生一些无意义的关联。但是,这并不能保证规则前......
现有的网络蠕虫检测方法大多都是基于包的检测,针对骨干网IP流检测的研究较少,同时也不能很好地描述蠕虫的攻击模式。为此研究了一......
先从理论上证明分布数据库局部频繁集与全局候选频繁集之间存在某种关系, 利用该关系设计分布数据库关联规则挖掘算法. 该算法的局......
本文论述了关联规则的基本概念、分类、基于频繁项集思想的关联规则挖掘算法-Apriori算法,以及在基础上对Apriori算法的各种改进算......
归纳分析了关联规则的典型挖掘算法及其思想,并通过实例比较各算法之间的差别,同时讨论了各种算法的优化技术,分析了他们的适应性及优......
为减少事务数据库的扫描次数和提高FP-growth算法的伸缩性,本文提出利用双链项头表改进FP-growth算法。......
论文首先对一种基于关联规则分类的算法做出了分析.然后对算法中的类关联规则的提取方法进行了改进,得到了一种新的基于关联规则分......
针对网络环境中大量短文本信息的鲜明特点,突破传统基于词标注的分类方法,提出了一种短文本频繁模式发现及其有效意义串分析算法。......
高维分类数据的处理一直是数据挖掘研究所面临的巨大挑战.传统聚类算法主要针对低维连续性数据的聚类。难以处理高维分类属性数据集......
分析了已有的垃圾E-mail过滤规则的算法的本质,给出了将邮件表示成事务的方法.在将垃圾邮件的训练集表示成事务集后,可以用FP-Tree......
介绍了关联规则挖掘算法的基本原理和基本概念,包括项目、项目集、置信度、支持度等。重点介绍了经典的Ariori算法、优化的FP_Grow......
针对基于FP-树挖掘最大频繁项集的算法需要大量的递归调用导致挖掘效率降低的问题,本文提出一种减枝策略并结合FP-树的结构,依据构......
期刊
目前,基于FP-树的最大频繁项集挖掘算法存在的一个问题是FP-树的规模过大,遍历树需耗费大量的运行时间,并且挖掘出来的很多频繁项......
该文提出了一种用FP-树挖掘大数据库的新方法及其算法PCM。在该方法中,首先把大数据库划分成子数据库的集合,然后在每个子数据库上构......
挖掘最大频繁项集是多种数据挖掘应用中的关键问题.在以往的最大频繁项集挖掘算法中,为了更新最大频繁候选项集集合,需要反复地扫描整......
FP-growth算法是目前已发表的最有效的频繁模式挖掘算法之一 .然而,由于在挖掘频繁模式时需要递归地生成大量的条件FP-树,其时空效......