基于果蝇算法的自适应KFCM和关联规则挖掘研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:D243435dsfsdfqwe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析和关联规则挖掘作为数据挖掘技术的重要研究方向,一直受到国内外专家学者的青睐。本文重点探讨模糊C均值聚类算法(FuzzyC-means, FCM)和Apriori关联规则挖掘算法。主要工作如下:1.提出基于果蝇算法的自适应KFCM聚类方法FCM算法引入模糊隶属度使其更加适合实际应用,如今,已成为应用广泛的聚类算法之一。然而,传统的FCM聚类算法在实际应用中亦存在局限,如算法对初始值敏感、易陷入局部极小值且易受到数据分布和模糊度参数的影响等。针对算法局限性,提出基于果蝇优化算法的自适应核模糊C均值聚类方法(FOAKFCM)。首先运用高斯核函数对FCM算法的目标函数进行优化,旨在将离散属性数据从低维特征空间变换至高维特征空间,扩大特征间差异。之后利用果蝇优化算法的迭代过程代替KFCM算法的迭代过程。接着引入聚类有效性评价指标MIA对基于核的FCM算法(KFCM)的模糊度参数自适应的选取。实验结果表明,该算法提高了 FCM算法的聚类精度,聚类效果更佳。2.提出基于位置存储的Apriori算法Apriori算法现应用于多个领域,它是早期的关联规则经典算法,提出之时成功处理了频繁项集产生时的组合爆炸问题,然而Apriori算法亦出现由于多次扫描数据库产生大量候选项集而导致时间和空间浪费的问题。针对该问题,一种基于矩阵位置存储的Apriori算法(L-Apriori)被提出。首先,扫描数据库构造矩阵,而后对矩阵中非零元素位置坐标进行数组变换生成候选项集并在位置坐标中不断删除无用冗余项集,进行动态剪枝实现对数据的关联规则挖掘,减少运行时间和空间。测试结果表明,本文提出的算法可以有效减少算法运行消耗的时间和空间,提高了 Apriori算法的挖掘性能。3. FOAKFCM算法和L-Apriori算法的应用将所提出的两种算法进行结合,应用到模糊关联规则的挖掘中。首先利用提出的基于果蝇算法的自适应KFCM算法(FOAKFCM)对数值型数据进行预处理,得到模糊分区和各数据隶属度,之后运用改进后的Apriori算法L-Apriori算法对离散化后的数据进行关联规则挖掘。实验结果表明,挖掘出的关联规则均具有强关联性,验证了所提出的模糊关联规则挖掘方案的可行性和有效性。
其他文献
本文围绕写作评价量规这一"标准的评分工具",从教学反馈的功能入手,以2017年高考新课标(I卷)英语试题中的书面表达为例,论述了写作评价量规在写作反馈环节中的中介作用。本文
<正>建构核心素养体系,是当前学科改革的重要任务之一。虽然中学历史学科核心素养的建构已取得了初步成果,但这些成果仍存在一些问题。如有的因过于概括而失去了核心素养的目
大牛地气田纵向上存在多个产层,层间跨距较大,储层致密,单层产能低,甚至不压裂就无自然产能。运用灰色关联分析原理优化了影响压裂选井的各个因素,在确定权重时采用系统工程
如何在没有达成临时安排的情况下,单方面利用争议海域的油气资源,是一个无法回避的问题。首先,在争议海域单方面进行"临时性"勘探和招标活动,是为国际法所应允的。其次,国际
课外阅读在语文教学中处于关键口。学生语文素养的提高在阅读兴趣的培养。小学阶段是激发学生学习兴趣的重要阶段,以阅读《木偶奇遇记》为例讲述数字化阅读平台的开发对于学
总结了舰载飞机的着舰安全性分类等级,研究了航母的航行运动以及随海浪的摇晃和振荡运动对舰载机着舰安全性的影响规律,并给出了与舰载机进舰速度适配的最优航母航行速度.研
关联规则挖掘是数据挖掘技术领域内的研究重点和热点之一,在各行业领域内有着广泛的应用,Apriori算法作为关联规则的代表性算法之一,其性能的好坏直接关系到关联分析的效率和
期刊
"习惯决定细节,细节决定成败",开展6S管理活动要达成实效,就必须要在提高员工的意识和素养上下功夫,把6S管理变成每个员工的自觉行动。