FP-TREE相关论文
历史保护建筑的修缮工程逐渐成为了城市更新与改造不可或缺的重点内容之一。通过词云图分析对上海市历史保护建筑工程修缮工作中的......
针对传统的线上教学效果评估方法主要依据学生的考试成绩来判定,存在延迟性较大、无法做到实时反馈等问题,文中使用FP-Growth算法对......
集合相似性连接从两个集合合集中找出相似度大于给定阈值的集合对,是大数据分析的重要操作,有着广泛的应用,如发现抄袭的文章、检......
本文基于数据挖掘技术,提出了一种对Web服务器的入侵检测方法,应用系统日志作为数据源,对用户及系统正常行为数据进行挖掘、分析,......
FP-growth算法是频繁模式挖掘中的经典算法,常用于静态数据集的挖掘。将FP-growth算法用于流数据方面,前人已经做了一些研究。但是FP......
针对中小馆普遍存在的中文图书学科主题标引问题,采用关联规则挖掘的FP-growth算法进行学科主题字段的数据挖掘,得出分类学科主题......
传统的信息挖掘技术已经无法满足大数据环境下日益复杂的应用需求,而分布式数据挖掘技术是解决这个难题的一种手段,因此提出了基于改......
理解用户行为模式对于系统减少资源消耗以及提高系统的可用性有着极其重要的作用[1]。本文基于用户行为的研究方法,针对某高校用户......
数据挖掘是一种半自动地从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出隐含在其中有用的信息和知识的过程。数据挖掘......
多层关联规则挖掘是关联规则领域里的一个重要研究方向,而作为多层关联规则挖掘中最耗时的部分——频繁模式挖掘,其算法的好坏直接......
许多数据挖掘算法都是基于加权图的,如聚类分析、协同过滤等,然而在应用这些算法之前,必须先构造出加权图。从给定数据集中提取出......
目前关系词识别规则库中共有规则734条,主要是基于字面特征的规则,仍需补充基于依存关系的规则。本文在依存语法的基础上,运用挖掘......
不同类型的移动目标,其轨迹特征会有较大的差别,如船舶的区域类轨迹和交通工具的折线类轨迹.通过对移动目标的历史轨迹所隐含的频......
挖掘频繁项集是数据挖掘中最基本的问题之一,而大型数据库庞大的数据使得传统的频繁模式挖掘算法难以适用。针对大型数据库的特点,在......
关联规则挖掘是数据挖掘的一个重要分支,它是指在大量数据中项集之间的有趣的关联或相关联系.本文介绍了当前关联规则挖掘的研究情......
...
提出一种基于反向矩阵结构在数据流上挖掘条件偏好和学习CP-nets的方法。利用反向矩阵的事务布局,减少了扫描数据库的次数,并且通......
关联规则的发现对于挖掘数据中的隐含信息非常重要,针对关联规则挖掘算法进行研究,分析了利用FP_Growth算法构建FP-tree和递归挖掘......
为了实现烟草病害准确预测和科学防治,提高烟草生产的质量,利用现代计算机技术、人工智能技术、数据库及数据挖掘技术实现了一个基......
分析了用各种不同的方法挖掘频繁闭合模式的优缺点,以及在什么时候该采取什么样的策略以取得较好的表现。提出了一个CLOSET+算法,......
分析了用各种不同的方法挖掘频繁闭合模式的优缺点,以及在什么时候该采取什么样的策略以取得较好的表现。提出了一个CLOSET+算法,......
随着数据库规模的增加或支持度阈值的减少,频繁模式的数量将以指数形式增长,FP-growth算法运行的时空效率将大为降低.本文提出一种......
在数据挖掘中,规模巨大的候选模式是约束系统性能的瓶颈,为解决该问题,提出了一个新的数据挖掘结构FPtree及相应的构造算法FPgrowt......
FP-growth算法用于关联规则挖掘分成两个阶段:构建频繁模式树和进行频繁模式挖掘;对这两个阶段分别进行改进,若项头表中存在同频度......
挖掘最大频繁模式是多种数据挖掘应用中的关键问题。提出一种挖掘最大频繁模式的快速算法,该算法利用前缀树压缩存放数据,并通过调......
挖掘最大频繁模式是多种数据挖掘应用中的关键问题。提出一种挖掘最大频繁模式的快速算法,该算法利用前缀树压缩存放数据,并通过调......
结合电网线路故障特点,对FP-growth算法进行改进:引入数据子库概念;对故障记录进行分组和分解;避免遗漏稀有故障;改进FP-tree的修剪技术......
典型协会规则考虑仅仅在交易枚举的项目。如此的规则被叫作积极协会规则,否定协会规则也考虑一样的项目,但是另外考虑项目否定(我。e......
关联规则是数据挖掘领域的一个重要分支,它反映了一个事物与其他事物之间互相依赖的关系。提出了一种简易而有效的频繁模式挖掘算法......
关联规则在数据挖掘中扮演着十分重要的角色,而Apriori算法和FP-growth算法是当前关联规则中两大主要算法。其中Apriori算法的主要......
FP-growth算法是关联规则挖掘算法中的经典算法,用于挖掘频繁项目集。但它的时间和空间效率还不足够高。提出了一种新的频繁模式树......
关联规则挖掘是数据挖掘领域的一个热点。Apriori算法作为进行关联规则挖掘的一种重要算法,其应用范围相当广泛。但用传统的Aprior......
在FP-growth算法中,为了产生条件FP树,必须扫描FP树两次。提出一种新颖的FP阵列技术,将FP-tree数据结构与FP阵列有效地结合起来,直接从......
简单数据集可以通过关联规则得到在数据间的相互关系;相当多的情况下,由于不能从关联规则得到隐藏在数据间的相互关系,需要按间接关联......
BOMO算法采用递归构造条件子树,在挖掘大数据集时耗时较长,执行效率低,为了解决这一不足,文中给出一种基于COFI-Tree的挖掘N-最有......
频繁项集挖掘是关联规则挖掘中最关键的步骤。最大频繁项集是一种常用的频繁项集简化表示方法。自顶向下的最大频繁项集挖掘方法在......
关联规则挖掘过程中,频繁项集的挖掘是最关键的步骤。最大频繁项集是最常用的频繁项集简化表示。基于FP-tree的最大频繁项集挖掘算......
关联规则挖掘过程中,频繁项集的挖掘是最关键的步骤。最大频繁项集是最常用的频繁项集简化表示。基于FP-tree的最大频繁项集挖掘算......
低速率拒绝服务攻击(LDoS)比传统的DDoS攻击更加难以检测与防范,为此,分析了加入LDoS攻击的网络流分布特性,通过设置流信息熵阈值定......
低速率拒绝服务攻击(LDoS)比传统的DDoS攻击更加难以检测与防范,为此,分析了加入LDoS攻击的网络流分布特性,通过设置流信息熵阈值定......
针对传统多层关联分类挖掘产生大量冗余规则而影响分类效率的问题,提出了一种基于类FP-tree的多层关联分类器MACCF(Multi-level Ass......
基于约束关联挖掘,近几年在国际上受到较大关注。从许多约束的关联挖掘算法中发现,传统的约束阈值大多是通过专家给定或经过反复试......
挖掘事务数据库中的最大频繁项目集是数据挖掘领域一个重要的研究方向.基于FP-tree的FPMAX算法是目前较为高效与稳定的最大频繁项......
挖掘最大频繁项目集是许多数据挖掘中的关键问题.为克服早期基于Apriori的最大频繁项目集算法中的缺点,相继有多种挖掘最大频繁项目......
WebLog挖掘的基本思想是将数据挖掘技术应用于Web服务器的日志文件,且客户对服务器的访问模式是一种序列模式.本文在基于一种简化......
基于FP树的FP-Growth关联规则挖掘算法,不需要产生候选项集,是当前频繁项集挖掘算法中应用最为广泛的算法之一.针对该算法在对大型......
基于FP树的FP-Growth关联规则挖掘算法,不需要产生候选项集,是当前频繁项集挖掘算法中应用最为广泛的算法之一.针对该算法在对大型......