闭频繁项集相关论文
库存物资的合理分类对企业库存管理活动至关重要,对于每类物资根据其性质有针对性地制定相应的库存控制策略,可以降低库存成本,优......
本文以专利中的技术术语作为事务、以术语中的词汇作为项,通过闭频繁项集挖掘方法,对专利文献中的技术术语的结构变化情况进行时序......
[目的/意义]将闭频繁项集挖掘技术应用于专利文本,进而分析技术的演化发展趋势,从微观层次描绘既定领域中主要的技术发展脉络.[方......
对现有的基于MapReduce的并行频繁项集挖掘算法进行了研究,提出一种基于后缀项表的并行闭频繁项集挖掘算法,通过后缀项表的引入及以......
本文在FP-Growth算法的基础上通过项合并的策略对FP-Growth做了优化,从而减少了挖掘频繁项集时的搜索空间,也减少了频繁项集的数量。......
期刊
在数据库中挖掘频繁项集是数据挖掘领域的最基本、最重要的问题.自从Agrawal的开创性工作以来,有关研究从未停止过.然而由于其内在......
对现有的基于MapReduce的并行频繁项集挖掘算法进行了研究,提出一种基于后缀项表的并行闭频繁项集挖掘算法,通过后缀项表的引入及......
数据流闭频繁项集挖掘算法得到了广泛的研究,其中一个典型的工作就是NewMoment算法。针对New-Moment算法存在搜索空间大而造成算法......
异常点发现是从大量数据对象中挖掘少量具有异常行为模式的数据对象,很多情况下,这些数据对象较之正常行为模式包含了更多用户感兴趣......
针对传统距离度量在高维数据上效果不明显问题,提出一种共享最近邻子空间聚类算法(SNN_SC),按照维把数据集转变为多个最近邻事务数据库......
关联分类具有较高的分类精度和较强的适应性。基于闭频繁项集有效压缩事务及FPL(Frequent Pattern List)简单数据结构等方面的优点......
0 引言 Web日志挖掘对于Web站点内部结构优化和页面内容的重新整合有重要的价值和意义。传统的Web数据挖掘方法如关联规则和聚......
由于概念格的完备性,在基于概念格的数据挖掘过程中,构造概念格的时间复杂度和空间复杂度一直是影响其应用的主要因素.结合iceberg......
闭频繁项集包含了关于频繁项集的完整信息,可显著减少频繁项集挖掘所产生的模式数量,在一定程度上降低了内存开销、提高了时间效率......
随着数据量的增长,如何快速有效发现频繁项集已成为挖掘关联规则的核心问题,而并行计算和闭频繁项集分别是一种处理大量数据直接有......
利用频繁模式表的线性表简单结构及闭频繁项集挖掘的优点,提出了一种闭频繁项集挖掘算法.模式签名向量间的合取操作以及向量计数操......
基于概念格的集中式数据挖掘算法,不能充分地利用分布式计算资源来改善概念格构造效率,从而影响了挖掘算法的性能.文中进一步分析......
研究专有的分布式数据挖掘算法是提高分布式数据库下数据分析和挖掘的有效方法.结合Iceberg概念格对于频繁项集精简表达的特性和其......
关联规则挖掘会产生大量的项集和规则,其中只有少部分是用户感兴趣和有价值的,其他大部分是冗余的或已知的。在已有的空间关联规则......
针对传统闭频繁项集(CFI)挖掘方法耗时长、效率低的问题,提出一种基于数据变换与并行运算(DTPC)的新型挖掘方法:设计基于质数对数运算的......
医保目录作为中国基本医疗保险制度框架中的重要组成部分,规定了基本医疗保险的保障范围,影响了基本医疗保险的保障水平。因此,合......
慢性肾小球肾炎作为慢性肾脏病中的主要病种之一,是对人类健康的一大威胁,而中医是调整人体机能的医学,它在慢性肾小球肾炎的诊疗......
提出一种基于位处理技术的三维数据挖掘算法——BD-Peeler算法。该算法利用计算机每次处理32位数据的特性,将三维数据集按位存储,......
随着计算机技术的高速发展和信息技术的广泛应用,数据流已在商务管理中的性能检测、网络流量管理中的异常检测及报警、零售业中的......
数据挖掘可以在现有的大量数据中提取有用的信息和知识。数据挖掘包括很多知识提取、模式分析的方法,其中挖掘频繁模式对于分析据之......
为应对基于向量空间模型的短文本聚类面临的关键词特征稀疏、高维及样本数量多等挑战,将潜在语义模型应用于短文本分析。首先基于......
在数据库中挖掘频繁项集是数据挖掘领域的最基本、最重要的问题.自从Agrawal的开创性工作以来,有关研究从未停止过.然而由于其内在......