基于FP-Growth的分类规则挖掘算法及其应用

被引量 : 0次 | 上传用户:frenta
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在国家海洋公益性行业科研专项课题“渤海海洋异构数据集成快速访问提取及智能分析技术”的支持下,针对FP-Growth算法在挖掘大型数据库时,在构建的FP-tree上挖掘关联规则的时候需要遍历的树的节点数目过多的现象,提出了FP-Growth算法的一种改进算法,降低建树的节点个数,而且在生成分类规则时,减少了遍历的节点数,降低了空间和时间开销。由于对于任何一个n个类别的分类问题,都可以转化为2个类别的分类问题来进行处理,因此本文基于FP-Growth算法,提出了一种基于FP-Growth的分类规则挖掘算法Class-FP-Growth算法。为了避免原始FP-Growth算法中搜索条件模式基这一步骤,本文在利用频繁1-项集生成的树中不包含类别属性,生成树的过程中,增加了相对支持数的计数,使得生成的树即为分类规则的条件树。不仅降低了树的生成规模,减少了空间开销,而且大大减少了无效分类规则的生成。基于提出Class-FP-Growth算法,以MODIS遥感影像为数据源,挖掘了绿潮MODIS影像检测规则,进而提出了基于知识的绿潮MODIS检测方法;以青岛附近海域2008年5-7月爆发的绿潮浒苔为研究对象,进行了绿潮检测实例研究;结果表明,本文挖掘出的绿潮检测规则能够较高精度的检测出一定绿潮生物密度的爆发范围。这也进一步的说明了本文提出的改进的FP-Growth算法的有效性。
其他文献
3D打印作为一种增材制造技术,因其具有无需模具、支持个性化及复杂结构成型、节省材料等优势,逐渐受到关注并开始应用于医疗、航空航天等领域。铁科院铁建所轨道工程事业部于
本文在对造船供应链(Shipbuilding Supply Chain,SSC)和造船供应链风险管理研究的基础上,分析了造船供应链风险的产生机理,依托风险管理的阶段划分模型,提出了造船供应链风险
目的本研究旨在阐明白细胞介素-1α(IL-1α)基因启动子区-889位点和白细胞介素-1β基因启动子区域-511位点基因多态性与缺血性脑卒中(Ischemic stroke,IS)的相关性。方法采用
<正>散文,在全国统编中学语文教材中,占有很大的比重。探讨一下散文的特点,对于搞好散文的教学,是会有所邦助的。 在古代,只要句子是参差错落、出于单行而不是骈偶的文章,都
本文论述了船舶柴油机废气排放污染对大气的影响,介绍了IMO(国际海事组织)对船舶柴油机排放的控制要求,以及国内外柴油机研究机构和制造公司所采取的对策。介绍了当前降低柴
近年来,随着信息技术飞速发展,网络攻击、信息泄露等事件层出不穷,说明当前网络信息系统安全防护不够,对网络安全事件的预警和防御手段欠缺。针对此现状,文章在梳理当前网络
安梨是优良资源,对燕山山区安梨资源进行调查,测定其果实内在和外在品质,为此资源的开发利用提供参考。在安梨成熟期,对燕山山区不同区域安梨资源果实进行采集,对影响其果实
变电站的设备智能化是实现智能电网的重要基础,随着IEC61850标准的完善,智能变电站对同步时钟精度和稳定性要求越来越高。IEEE1588同步时钟作为一种网络对时系统,具备诸多优点,但
经过对比与分析国内外多年的线路运行经验表明,由于输电线路一般距离较长而且分布面积较广,再加上有些地区气候条件和地形复杂等原因,高压输电线路40%~70%的故障主要是由雷电直
以人为本教育观应该是一种具有显著价值性、系统性的理论体系,该理论要求教育活动在自己的观念形态上,应该以人为本;在教育与各种社会要素的关系中,应该以教育为主;在学校的