基于回溯的最大频繁项集挖掘算法

来源 :电子科技 | 被引量 : 0次 | 上传用户:leeyongfan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对Apriori类算法多次扫描数据库和FP-tree类算法需要构建大量条件模式树的问题,文中提出了挖掘最大频繁项集的GBMFI算法。采用垂直格式存储事务数据库,以枚举树为基础,利用子集非频繁性质和父子节点支持度信息在搜索过程中对枚举树进行剪枝,最终得到最大频繁项集。通过实验对比,结果证明了算法的有效性,尤其适用于稀疏数据集。
其他文献
通过2012—2013年顺昌县大历镇阔叶树保留木资源调查分析,结果表明:不同径阶阔叶树保留木的株数分布整体上呈"L"形,每个径阶阔叶树保留木达200株以上的主要分布于径阶为6-14cm之
针对传统工业现场测试系统的测试精度较低、数据传输距离短、现场布线冗余、多种总线不兼容等缺点,文中提出了一种基于以太网的自动测试系统。以MINL2440和PC机为核心,对振动信
为解决传统的光固化3D打印机PC端控制系统控制效率和自动化程度低的问题,文中提出了基于嵌入式ARM系统的光固化3D打印机的控制方案以代,替传统的PC控制方式,开发与设计了基于
杉木作为南方地区主要造林树种,在生产中得到广泛的应用,要保持怎样的密度,才使得其效益达到最大化,是林业工作者共同研究的问题。通过采取保留1 500株·hm^-2(强度)、1 80
在 TD - LTE上行系统中,有效地资源分配对系统性能有着决定性作用,仅通过信道质量进行资源分配的 分配算法没有考虑UE的数据业务,会造成实际资源利用率不高.采用Kuhn- Munkre
二次型DC-DC变换器拓宽了变换器输入到输出电压的传输比,提高了高传输比场合下的传输效率,与传统变压器相比因为储能元件的增加电路功耗也会增大。为具体分析其工作过程中的功
在甘家湖国家级自然保护区荒漠植被典型分布区域均匀布设样方,进行全面的植物资源调查。结果显示:保护区有维管束植物448种,植被类型包括7个植被型组,7个植被型,14个植被亚型,
在火电厂输煤传送系统中,需要采用变频器改变交流电机频率,实现交流电机调速。文中针对输煤传送系统中传统的直流电机维护困难、成本高、对环境要求严格的问题,采用交流电机
随着信息交流的密切,人工翻译工作量大,且收益较低,矛盾凸显。文中基于此背景以交互式机器翻译技术(IMT)为核心,针对各类用户翻译过程中查询调用行为出现的频繁鼠标、键盘切换
在保证数据传输实时性要求的同时,要求实现主机对多个节点的控制时,可以引入异步FIFO存储器。方向标志与门限的方法是存储器空/满状态判断的主要方法之一,保证系统内多个存储