模糊C均值聚类算法的相关问题研究

来源 :中国海洋大学 | 被引量 : 0次 | 上传用户:suzuzl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模糊C均值聚类算法(FCM:Fuzzy C-Means)的研究领域隶属于数据挖掘的聚类分析方向,是一种基于目标函数的无监督的聚类分析算法。它是在传统聚类分析算法的基础上引入模糊数学理论的概念,并利用隶属度函数来表示数据对象相对于类簇的所属关系。本文主要研究内容是:首先,从模糊C均值聚类算法的目标函数进行推导,推导出在聚类分析取得最优化解时隶属度函数μ( x)和聚类中心的数学表达式。然后,从模糊C均值聚类算法的相关问题入手,论述了解决问题的理论依据和具体思路,并提出的PFCM(PFCM:Optimal Fuzzy C-Means)算法。该算法的主要内容是:第一,由于FCM的初始聚类中心是随机产生,聚类的效果可能会随着初始聚类中心的选择而波动。本文根据推导出的聚类中心的表达式,采用数据分段方法,确定初始聚类中心,以减少聚类结果因初始聚类中心的随机性选择而引起的波动。第二,由于FCM算法在计算数据对象各维特征的距离时某些维度特征的量纲或者偏离度可能差异巨大,进而有可能掩盖其它维度的特征作用。本文运用层次分析法,从数据对象纵向上构造了一个成对比较矩阵,以各维特征的方差为基准,计算各维特征的权重来平衡它们的作用。第三,由于FCM算法是一种迭代爬山的搜索算法,它在处理高维数据时效率比较低。本文利用多项式拟合的方法,从数据对象横向上建立非线性映射,将原数据对象映射到一元多次函数的系数上,使用一元多次函数的系数来代替原数据对象的各维数据,以降低原数据对象的维度,进而增强FCM算法处理高维数据的能力。第四,由于FCM算法在迭代过程时使用距离更新聚类中心,当奇异点的范数过大时,可能会极大地减少其他数据对象的作用。本文在每次算法迭代过程时,检测各个类簇中潜在的奇异点,然后根据方差分析假设检验的方法,判断它是否是真正的奇异点。如果接受假设,则不将该奇异点加入到调整聚类中心的集合中,反之,则加入,以此来减少奇异点对聚类结果的影响。最后,本文通过实验比较了PFCM算法与FCM算法,并将PFCM算法应用于模式识别中。实验结果和应用实例表明:PFCM算法在一定程度上优化了FCM算法,提高了FCM算法的性能和效率。
其他文献
Objective To compare the efficacy and safety between Chinese generic imatinib(Xinwei~,Jiansu Hansoh Pharmaceutical Group Co.,Ltd.)and branded imatinib(Glivec~
电力系统无功优化问题包含多个变量,既有连续的也有分散的,同时约束条件较多,优化目标多样,属于混合非线性规划问题,其多目标、多约束、多变量的特性使得优化问题的求解比较困难。无功优化问题的研究对电网的安全、稳定运行具有重要的作用,因此寻求一种求解速度快、质量高的算法对解决无功优化问题具有重要的意义。蚁群算法和粒子群算法均属于群体智能算法,蚁群算法具有较强的鲁棒性和搜索较好解的能力,且其在解决离散的优化
1998年8月8日1点30分,在南冶煤矿-180水平候车室里,完成了检修任务的早班矿工都拥挤在一起,人头攒动,焦急地看着运人皮带缓缓转动,却无一人乘皮带上井。怎么回事呢?8月8日早班,南冶煤矿停产检修。按
莫高窟俗称“千佛洞”,坐落于河西走廊西段的敦煌。它以精美的壁画和雕像闻名于世,有着“东方卢浮宫”之美誉。它的艺术和历史价值毫无疑问地吸引了国内外大量游客慕名前来参观
目的 探讨应用股骨近端防旋髓内钉 ( PFNA) 治疗老年股骨粗隆间骨折的疗效及对机体关节系统功能带来的影响.方法 选取2014 年2 月~2017 年9 月入住我院骨科的老年股骨粗隆间骨
伴随着Internet规模的日益扩大,多媒体数据等有着高服务质量需求的应用数据在网络数据中所占的比例也越来越重,原有网络体系结构中复杂的用户数据传输平台层次结构和缺乏有效
随着海洋探测与开发的不断深入,具有自主导航能力的水下航行器的需求越来越大。在复杂的水下环境中,声纳传感器是自主水下机器人(AUV)重要的感知设备,水下环境探测、目标特征
近年来,随着通信技术、网络技术与控制技术的迅猛发展,引发了一场工业控制领域深刻的变革。控制局域网CAN以实时性好、可靠性高、分布式等特点,在工业生产过程中广泛使用,但
目前,根据用户查询请求,搜索引擎返回的搜索结果与用户需求的相关程度并不理想。本文探讨将推荐技术引入到搜索引擎中,研究一种综合协同过滤推荐技术和信任机制的用户相关性计算
随着网络的飞速发展,商务网站逐渐增多。如何根据用户的行为习惯,优化网站结构或主动地为用户提供一些个性化服务,成为了困扰网站管理者的主要难题,Web日志挖掘的出现为解决