模糊聚类算法的有效性及参数m的研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:jianhua230747
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机网络化迅猛发展的时代,如何有效、快速地从大量数据中获取人们需要的知识成为许多学者以及研究人员关注的焦点。数据供给能力和数据分析能力间的矛盾日益突出,使得人们迫切需要一种能够对数据进行更高层次的分析和提取的自动化技术——数据挖掘技术。   作为数据挖掘的一个重要分支,聚类分析引起了人们的广泛关注,它既可以作为独立的数据挖掘工具供人们分析大量数据,也可以作为其他数据挖掘算法的数据的预处理。在现实世界中,许多客观事物之间的界限通常是模糊的,对事物进行分类时就必然伴随着模糊性。模糊聚类分析是建立在样本对于类别识别的不确定性描述,更能够准备客观反映现实世界事物之间的关系,从而成为聚类分析的研究主流。   在模糊c均值算法中,参数m起着举足轻重的作用,参数m的引入一定会对聚类分析以及聚类结果产生影响,最直接的影响就是将聚类的硬划分变成了模糊聚类划分,而且不同的m的值会产生不同模糊程度的数据划分,从而产生不同的聚类结果,因此,对参数m的选取具有重要的意义。本文重点研究了基于模糊决策的参数m的优选方法,取得了一定的研究成果。   在应用FCM算法时,一个首先需要确定的参数就是数据集的聚类数,因此对于给定的数据集的聚类数是否合理就是对该聚类结果进行有效性评价。目前,对聚类数是否合理的问题,学者们一般采用有效性指标进行评价。迄今为止,已经提出若干检验聚类有效性的算法。本文着重对Xie-Beni指标及其扩展性进行研究,对该指标中存在的问题做了相应改进,引入了一个点密度惩罚因子,定义了一个新的聚类有效性指标并对指标进行理论分析。最后的数值仿真实验表明了它具有良好的评价功能和鲁棒性,能够有效地克服原指标的缺点。  
其他文献
随着计算机软硬件和图形学技术的高速发展,使得利用计算机自动创作动画成为一种普及的动画制作方法。近年来,随着运动捕获设备的广泛使用,生成了大量具有真实感的3D人体运动数据
随着科技的发展,计算机三维模拟模拟慢慢地进入人们的生活,并广泛地应用于各个领域,如军事、工业、气象、交通、教育、通讯、社会、娱乐等等。其中布料的三维模拟不仅可以增强窗
基于图像的建模技术多年以来一直是计算机视觉领域研究的一个热点问题。它是利用计算机视觉和计算机图形学的相关知识,仅仅根据物体在不同角度的一系列图像中记录的相关信息来
序列模式挖掘是数据挖掘领域中一个活跃的研究分支,有着广泛的应用前景,如顾客购买行为分析、Web点击流分析以及生物序列分析等,目前已经得到了广泛地研究,提出了许多经典的
在数据流测试技术中,覆盖程序中所有变量的定义-使用路径是衡量数据流测试好坏的重要标准之一。但是,由于变量的定义-使用路径中存在测试用例无法覆盖的路径,而且路径的插桩点过
RootKit是能够持久、可靠地存在于计算机上,而难以被检测的一组程序或代码,它使得攻击者可以隐藏自己的踪迹,并且拥有超级用户的权限。近年来,攻击者通过将RootKit与恶意程序相结
最小生成树问题是一个经典的网络优化问题,而实际应用中往往要对生成树加上某种限制,形成了一类有约束的最小生成树问题,如在有n个顶点的图G中求至少带有L片叶子的最小生成树,即
本文以基于小波变换的静态图像压缩算法的原理为基础,主要研究了静态图像压缩算法的实现,为其在嵌入式体系结构下的实现奠定基础。   论文研究了小波分析,多分辨率分析,Mallat
随着语义Web的发展,在线的语义数据越来越丰富。面对庞大的由语义对象和它们之间的语义关联构成的数据之网,帮助用户挖掘到数据之网中的语义关联模式进而能够快速有效地构建用
本文主要实现了基于混合预处理方法的嵌入式零树块编码算法,其目的是为了让该算法能够在以后的嵌入式体系结构中更好地应用。   首先,研究了小波变换以及多尺度几何分析方法