论文部分内容阅读
[摘 要]:FCSS算法和FCM算法具有相同的优缺点,而与FCM和PCM相结合的聚类算法能很好的解决FCM算法容易陷入局部极值点的缺点。在本文中,首先证明了用此FCM-PCM模型来对曲线进行识别的可行性。数值实验表明:新方法对球壳型数据有令人满意的效果。
[关键词]:FCM算法 FCM-PCM模型 FCSS算法
中图分类号:0235 文献标识码:A
一、 引言
由于FCM算法在数据点存在噪声或类之间的聚类较为接近时,容易陷入局部极值点[1],这样得到的聚类结果并不能令人满意。因此在文献[2]中提出了一种FCM-PCM相结合的聚类算法(IPCM)。通过数值试验表明,该算法能有效的克服FCM存在的缺点。因此,在本文中通过利用该种模型,通过与FCSS相结合来提出一种新的曲线识别算法(IPCSS)。
二 、IPCSS模型的可行性证明
在改进的曲线识别算法(IPCSS)中采取代数距离[3],使计算变的简便。建立模型如下表示:
设N个点的具有球壳形状的数据集,,划分成C类。IPCSS算法的目标函数如下:
从表2.1可以看出,IPCSS算法给出的类中心及半径都与真实的类中心及半径很接近,而FCSS算法给出的类中心及半径与真实的类中心及半径相差甚远。进一步,利用上述数据重复100次试验,IPCSS算法有48次正确聚类结果而FCSS算法仅有11正确聚类结果;当降低噪声进行上述实验时,IPCSS算法效果更好。
五、 改进的IPCSS算法
从数值实验中我们可以看出,IPCSS算法较FCSS算法有一定程度上的改进,但是计算结果并不理想。。因此我们在算法步骤○6之后加入步骤○7如下:
○7 判断聚类结果是否正确,若正确,直接输出,若不正确,返回○1重新计算,直到正确输出为止。
如此势必对计算时间具有影响,因此将其与正确率较高的与遗传算法相结合的模糊球壳聚类算法[4](GA-FCSS)来进行比较,实验结果令人满意。
实 验4 数据来自四个圆形数据类(如图4.7),圆心分别为(25,30)、(27.5, 34.33)、(27.5,31)和(30,30),半径分别为5、5、15和5,半径为每个圆上等圆心角地各取40个点,每个点的每个分量都随机地加上一个期望为0、标准差为0.25的Gauss噪声。和都取2,精度设定为,利用FCSS算法、IPCSS算法计算得到的聚类结果见表3.1、图3.2-3.3
从表4.1中可以看出,GA-FCSS算法、IPCSS算法对该数据点都具有良好的聚类结果。但在计算时间方面,IPCSS算法则更具有优势。
六、 结论
文中针对FCM和FCSS算法的缺点,以及对FCM-PCM算法的优势进行了总结运用,提出了一种新曲线识别的聚类算法IPCSS。实验表明:该方法能有效的解决FCSS算法不能解决的同心圆问题,另外,在运行时间上也比具有良好聚类结果的GA-FCSS算法具有优势,而且该方法保证聚类结果百分百正确。
参考文献:
[1] 高新波.模糊聚类分析及其应用[M].西安:西安电子科技大学出版社,2004.
[2] Jiang-she Zhang, Yiu-Wing Leung. Improved possibilistic c-means clustering algorithms[J]. IEEE Trans. Tram Fuzzy System, 2004, 12(2): 209-217.
[3] Frank H?ppner,Frank Klawonn. Fuzzy Cluster Analysis: Methods for classification data analysis and image recognition[M]. New York,USA,1999.
[4] 惠周利,杨明,潘晋孝.基于遗传算法与FCSS相结合的模糊球壳聚类算法[J].传感器与微系统,27(12),2008.
[关键词]:FCM算法 FCM-PCM模型 FCSS算法
中图分类号:0235 文献标识码:A
一、 引言
由于FCM算法在数据点存在噪声或类之间的聚类较为接近时,容易陷入局部极值点[1],这样得到的聚类结果并不能令人满意。因此在文献[2]中提出了一种FCM-PCM相结合的聚类算法(IPCM)。通过数值试验表明,该算法能有效的克服FCM存在的缺点。因此,在本文中通过利用该种模型,通过与FCSS相结合来提出一种新的曲线识别算法(IPCSS)。
二 、IPCSS模型的可行性证明
在改进的曲线识别算法(IPCSS)中采取代数距离[3],使计算变的简便。建立模型如下表示:
设N个点的具有球壳形状的数据集,,划分成C类。IPCSS算法的目标函数如下:
从表2.1可以看出,IPCSS算法给出的类中心及半径都与真实的类中心及半径很接近,而FCSS算法给出的类中心及半径与真实的类中心及半径相差甚远。进一步,利用上述数据重复100次试验,IPCSS算法有48次正确聚类结果而FCSS算法仅有11正确聚类结果;当降低噪声进行上述实验时,IPCSS算法效果更好。
五、 改进的IPCSS算法
从数值实验中我们可以看出,IPCSS算法较FCSS算法有一定程度上的改进,但是计算结果并不理想。。因此我们在算法步骤○6之后加入步骤○7如下:
○7 判断聚类结果是否正确,若正确,直接输出,若不正确,返回○1重新计算,直到正确输出为止。
如此势必对计算时间具有影响,因此将其与正确率较高的与遗传算法相结合的模糊球壳聚类算法[4](GA-FCSS)来进行比较,实验结果令人满意。
实 验4 数据来自四个圆形数据类(如图4.7),圆心分别为(25,30)、(27.5, 34.33)、(27.5,31)和(30,30),半径分别为5、5、15和5,半径为每个圆上等圆心角地各取40个点,每个点的每个分量都随机地加上一个期望为0、标准差为0.25的Gauss噪声。和都取2,精度设定为,利用FCSS算法、IPCSS算法计算得到的聚类结果见表3.1、图3.2-3.3
从表4.1中可以看出,GA-FCSS算法、IPCSS算法对该数据点都具有良好的聚类结果。但在计算时间方面,IPCSS算法则更具有优势。
六、 结论
文中针对FCM和FCSS算法的缺点,以及对FCM-PCM算法的优势进行了总结运用,提出了一种新曲线识别的聚类算法IPCSS。实验表明:该方法能有效的解决FCSS算法不能解决的同心圆问题,另外,在运行时间上也比具有良好聚类结果的GA-FCSS算法具有优势,而且该方法保证聚类结果百分百正确。
参考文献:
[1] 高新波.模糊聚类分析及其应用[M].西安:西安电子科技大学出版社,2004.
[2] Jiang-she Zhang, Yiu-Wing Leung. Improved possibilistic c-means clustering algorithms[J]. IEEE Trans. Tram Fuzzy System, 2004, 12(2): 209-217.
[3] Frank H?ppner,Frank Klawonn. Fuzzy Cluster Analysis: Methods for classification data analysis and image recognition[M]. New York,USA,1999.
[4] 惠周利,杨明,潘晋孝.基于遗传算法与FCSS相结合的模糊球壳聚类算法[J].传感器与微系统,27(12),2008.