基于聚类的模糊关联规则挖掘

来源 :第二十二届中国数据库学术会议 | 被引量 : 0次 | 上传用户:julian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则具有多种类型,其中包括数值型关联规则,其基本思想是将数值型属性进行离散化,从而将问题转换为类别型关联规则挖掘问题.但是数值型属性离散化存在着锐利边界值问题,即在挖掘过程中,区间的边界值要么过分强调,要么被忽略.因此,人们将模糊集理论]引入到数值型关联规则挖掘中,提出了一些模糊关联规则的挖掘算法,例如:在文中,利用模糊集理论挖掘数值型关联规则算法FARM;在文中,考虑到人们对不同项目的感兴趣程度不同,以及不同项目对数据库的影响程度不同,在此基础上又提出了加权支持度和加权置信度的加权模糊关联规则挖掘算法FWAL.这些算法较好地解决了锐利边界值问题,但算法需要领域专家预先给出相关模糊集及其隶属度函数,以便将数值型属性模糊化.这在很多应用领域是不现实的.为此,本文提出一种基于聚类的构造模糊集及相应隶属度函数的算法GFAM,并在此基础上提出模糊关联规则挖掘算法AMFAR.对于数据库中每一个数值型属性的数据,用DBSCAN[7]聚类算法进行聚类,根据聚类结果构造该数值型属性的模糊集,并为该模糊集定义相应的隶属度函数,隶属度函数的值域为[0,1].
其他文献
本文针对数字图像在产生和传输过程中经常出现的脉冲噪声,提出了一种基于模糊神经网络的智能滤波方法.该方法利用神经网络来实现模糊推理,不仅能有效滤除噪声,而且还很好的保
清晰虹膜图像的获取是虹膜识别系统中非常关键的一个问题,图象质量好坏对整个虹膜识别系统的性能有着直接的影响.通常情况下,由于运动和焦距等因素,可能造成虹膜图像的模糊,
结合电子机房工程的监理实践,根据现行相关的国家规范,对其各项系统及各种自动化电气设备进行监理验收的过程,探讨电子机房工程的特点及其监理要点,供同行参考。
分布式数据挖掘通过并行的挖掘算法,可以对分布在不同物理节点上的数据进行分析,不需要将大规模数据集集中起来,扩展了数据挖掘技术的应用范围。首先分析了分布式数据挖掘DDM要
本文研究了基于指纹和声纹融合的身份验证方法,首先分析了指纹和声纹身份鉴别系统输出概率模型,在研究基于Bayes理论与Neyman-Pearson准则融合身份验证方法基础上,提出加权方
对智能建筑领域中普遍采用的现场总线进行了分析,基于ARM微处理器和μCLinux操作系统构建一个具有以太网功能的嵌入式系统,将该嵌入式系统作为智能建筑中设备管理节点。介绍了
本文论述了文档一体化应用平台建设的背景和必要性。国内文档一体化发展的技术现状、市场的需求情况以及文档一体化建设的主要内容,同时对文档一体化建设的经济和社会效益进行
本文主要是利用统计的方法来处理缺失数据,都是针对随机缺失的情况(非随机缺失的情况可能导致一些检验统计量是有偏的),且大都是针对数据集中变量成一定相关性的缺失数据处理
据中国互联网信息中心2005年1月发布的,用户经常使用的网络服务中搜索引擎占65%.网络信息的迅速膨胀使得搜索引擎越来越重要.同时,由于网络上的信息量十分巨大,没有任何一个搜
XML的出现给数据库领域带来了很多新的问题,因为XML自身具有强大的功能,将有用信息以XML文档形式发布到Internet上变得至关重要,所以XML数据的发布技术就成为研究的热点.目前