【摘 要】
:
关联规则作为一种数据挖掘的工具,它能够发现数据项集之间有趣的关联.在关联规则的算法中,Apriori算法是其中的关键算法之一.面对大量复杂的数据集,怎样选择数据结构,怎样优
【机 构】
:
中国科技大学研究生院,中国科学院计算技术研究所智能信息处理重点实验室
论文部分内容阅读
关联规则作为一种数据挖掘的工具,它能够发现数据项集之间有趣的关联.在关联规则的算法中,Apriori算法是其中的关键算法之一.面对大量复杂的数据集,怎样选择数据结构,怎样优化处理过程,对于此算法的性能将会十分重要.该文首先介绍了关联规则的原理和Apriori算法的实现,然后提出了对该算法的若干改进,例如:采用树型结构存取频繁项集,使用三种缓存优化的方法等.这些优化都能够在整体上提高算法的效率.对于大数据项,试验显示,这些改进能够正确、有效、快速地实现Apriori算法.
其他文献
在深入研究尺度小波变换和嵌入式小波零树压缩编码算法的基础上 ,探讨了一种改进的小波零树编码算法 .通过采用基于嵌入式零树预测扫描算法的改进小波变换编码方法 ,对小波分
在大型多相流实验装置上研究了水平管气液分层流和环状流流动特性,采用气相动量方程求解了气液相间摩阻系数,与已有的经验公式进行了对比分析,建立了适于水平管气液两相分离
根据油田加热炉节能改造之实际需要,研究了火筒式加热炉改造用热管元件优化设计方法,以热管流动阻力为目标函数建立了数学模型,并采用混合罚函数(SUMT)法对实际问题进行了求
由于EV(Errors-in-Variables)模型(也称测量误差模型)的最大似然估计由正交回归给出,而正交回归对污染数据是敏感的,所以,需要采用稳健的统计方法来估计模型参数本文在多元EV
β-半乳糖苷酶能够水解牛乳和其它乳制品中的乳糖,同时还具有转半乳糖苷作用.本文通过实验分析了米曲霉β-半乳糖苷酶的酶学性质,并证实了其对乳糖的水解作用.
针对非线性船舶控制的困难,提出采用多模型智能控制的思想方法.非线性船舶模型可以在其关键工作点线性化,例如:N个工作点.这样就得到N个简单的线性模型.这N个线性模型能够很
点到点隧道协议(PPTP)是用来保证TCP/IP上的PPP连接安全的。由于MS-CHAP中存在的安全问题,Mi-crosoft发布了新版本的MS-CHAPv2。文章将概述MS-CHAPv2中对认证和加密密钥产生
随着交通事故及各种高能量损伤的日益增多,胫骨缺损病例在临床十分多见,治疗非常棘手.20世纪80年代以前主要以传统单纯自体骨植骨治疗为主,由于其"爬行替代"的愈合机制,对超
企业信息平台实现有业务往来的各应用系统之间的交互,同时从分散的各应用系统中提取公共信息,为企业信息发布提供及时、可靠的数据.文章介绍企业信息平台的设计方案,并探讨消
为了根据所给的客流量及运营情况排出公交车调度时刻表,并尽可能地满足乘客与公交公司双方的利益,我们建立了基于图形分析的模型一和基于计算机模拟的模型二,并在模型扩展中