基于目标函数改进的模糊聚类算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:bin_go_0820
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在数据挖掘中,聚类分析占据着重要的位置,它是一种无监督分类。在聚类算法中,可能性C均值(PCM)和模糊C均值聚类(FCM)是两种比较经典的算法,他们是基于目标函数的算法。本文针对他们的聚类精度不高,鲁棒性差的缺点,通过改进目标函数来提高聚类精度和增强算法的鲁棒性。主要工作如下:  (1)PCM算法是一种应用比较广泛的聚类方法,但该算法对其参数比较敏感,使得聚类精度和鲁棒性较差。为了解决上述问题,提出了一种基于遗传方法的直观模糊可能性C均值聚类算法(IFPCM-GA),该方法保留了PCM的优点,同时使用核函数避免非鲁棒性的欧氏距离,提高了算法的鲁棒性;把直观模糊集理论融入到加核的PCM中得到直观模糊可能性C均值聚类(IFPCM)算法,IFPCM可以获得进一步精确的隶属度与聚类中心,从而改善算法的聚类性能;采用遗传方法搜索IFPCM参数的最优值,能够有效改善聚类结果。  (2)提出一种基于邻域信息的自适应核模糊聚类算法。模糊聚类是一种应用比较广泛的聚类算法,但是由于受噪声和野点的干扰,其算法的鲁棒性较差。以往的聚类算法,通常引入核函数来提高算法的鲁棒性。为了能够进一步增强算法的鲁棒性,首先加入聚类数据的近邻信息,获得每个聚类数据的邻域均值,来平滑掉噪声点的影响。在模糊聚类的同时,还期望能够获得更纯粹的划分,因此在目标函数中加入隶属度约束项产生更纯粹的划分。最后,采用免疫克隆算法来搜索获得该算法中参数的最优值,合适的参数值能够进一步提高算法的性能。  (3)提出一种改进模糊划分的核模糊C均值聚类算法。聚类分析追求两点:同一簇中的数据更紧凑,不同簇间的数据更离散。以往的模糊聚类算法,在聚类的时候会更多地考虑前者,而往往忽略了后者;通过加入不相似矩阵来改进隶属度,可以提高类间的分离性,能够有效改善聚类效果。在聚类时,每个数据对聚类的贡献是不一样的,应用密度权重为每个聚类数据加权,可以获得更精确的聚类中心。
其他文献
本文主要对高功率毫米波传输发射系统中的天线及模式转换器进行研究。具有良好辐射特性的天线是高功率毫米波发射系统的关键部分之一。在毫米波波段,菲涅尔区相位修正平面(FZ
由于不同成像设备的原理不同,对同一目标拍摄所得图像就具有不同的特点。通过一定的算法将这些图像融合在一起,得到的合成图像就具有这些源图像上特有的优点,可以提供更加丰富的
胚胎-子宫轴的建立以及蜕膜重塑是哺乳动物胚胎植入后子宫发育的两个标志性事件。啮齿类动物中,胚胎在植入阶段相对于子宫环境表现出明显恒定的方向,即胚胎在子宫垂直轴的系膜
固有免疫系统是感知病原体或宿主自身危险信号的复杂系统,它通过胚系编码的模式识别受体(pattern-recognition receptors,PRRs)识别病原体上广泛编码的病原体相关分子模式(path
随着高速电路向更高密度、更快工作速度的趋势发展,串扰问题愈发突出,严重的串扰噪声会影响接收端信号的正常判定,导致误触发,甚至造成系统的非正常运行。本文从电磁耦合的角度解
本文通过对荣华二采区10
期刊
随着数据采集在现代工业及科学研究中的重要地位日益突出,人们对于数据采集设备的要求也不断提高。在信号测量、图像处理、音频信号处理等一些高速、高精度的测量中,都需要进
相变材料能够在晶态与非晶态之间进行快速可逆转变;并且两态具有巨大的电学及光学性质差异;这一独特的性质使其不仅在光盘及相变存储器等领域得到应用;并且在非易失逻辑运算
神经系统的疾病是对人类健康威胁最为严重的疾病之一,除了外界损伤造成的神经系统损害外,神经系统自身病变导致的神经退行性死亡更是目前难以治疗的严重影响人类健康的疾病。神
硫化氢(H2S)已经被证实是继一氧化氮(NO)、一氧化碳(CO)之后的第三种气体信号分子。在哺乳动物中,它参与了血管舒张、胰岛素分泌、炎症反应、细胞周期以及伤害应激反应等多方