基于SQL的不产生候选集的频繁模式挖掘

来源 :计算机应用 | 被引量 : 3次 | 上传用户:dingzhiyoulan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频繁模式挖掘是数据库挖掘中的一个十分重要的组成部分 ,然而以前的许多研究都是基于Apriori的产生候选集的测试迭代方法。这些方法普遍存在需要多次扫描数据库 ,对产生的大量候选集进行迭代测试的缺陷 ,尤其是对于挖掘长模式时这种缺陷就尤为突出。FP growth方法采用分而治之的策略 ,只需对数据库进行二次扫描 ,而且避免了产生大量候选集的问题。文中的基于SQL的频繁模式挖掘方法既是在此基础上提出的 ,采用子查询及DBMS扩展技术 (如用户定义函数等 )对该方法进行了改进。
其他文献
讨论了用支持向量机进行多分类的若干学习策略,提出了一种新型图像特征提取方法,以此来实现对鞭虫等九种寄生虫卵图像自动识别和分类,平均识别率优于传统神经网络,达到了93.9%,为寄生虫卵图像识别提供了一种新方法。
本文通过对大白菜中甲基托布津残留量的测量过程中不确定度的评定,发现标准曲线的线性方程拟合、样品重复测定和标准溶液配制是影响大白菜中甲基托布津残留量测量结果的主要
<正>7月13日至15日,"第九届中国民族植物学大会暨第八届亚太民族植物学论坛"在昆明召开.此次大会和论坛由中国植物学会民族植物学分会主办,中国科学院昆明植物研究所承办.大
目的探讨三阴性乳腺癌中的血管内皮生长因子(VEGF)表达及临床意义。方法应用免疫组织化学方法检测三阴性乳腺癌患者69例和非三阴性乳腺癌患者293例肿瘤组织VEGF表达情况,分析VEG
目的考察广西不同产地茉莉花药材重金属元素含量和农药残留量,并对其安全性进行分析。方法采用原子吸收分光光度法,测定广西产10批茉莉花药材中铅(Pb)、镉(Cd)、砷(As)、汞(Hg)、铜(Cu)含
提出并建立了一种以免疫学理论为基础的网络适存性安全框架。该框架是一个三层结构 ,包括防御层、免疫层和适应层。与传统的刚性安全体系不同 ,它是一个柔性安全体系 ,以增强网络系统在非安全环境下的适存能力
分析了互联网用户接入认证技术在网络运营中的缺点,综合传统窄带网络的客户身份识 别技术,提出了基于智能卡的互联网认证技术,并对其进行了较为详细的描述。
基于具突发性Heavy业务流的TES(Transform Expand Sample)模型,推导出一个计算Heavy业务流有效带宽的实用的公式,并由此公式求得的有效带宽,作为基于测量的接纳控制(MBAC)算法中新业务流所申请的带宽。仿真结果表明,采用该计算公式求得的有效带宽,MBAC算法可以取得更好的网络性能。