论文部分内容阅读
聚类分析作为一种非监督学习方法,已经广泛的应用到机器学习、数据挖掘、人工智能和图像处理等领域,并成为该领域的研究热点。随着聚类分析的备受关注,存在的一些问题需要研究者去解决,这些问题包括如何自动确定聚类的数目,如何获得全局最优解,如何对任意形状的数据集合进行聚类,如何将多种比较成熟的聚类算法有机的结合在一起,以及如何将聚类算法应用到如数字图像处理等特定领域中。本文针对这几个问题进行探讨,主要包括以下几个方面:1)在基于超球形数据的聚类上,本文提出了一种基于进化算法的自适应聚类方法,该方法的基本思想是将聚类问题转化成一个全局优化问题,然后使用进化算法对其优化。其中包括一个可以平衡类内紧凑度和类间分离性的有效性指标函数作为自适应进化聚类的目标函数。在编码方式上,设计了三种可以表示不确定聚类数目的编码方法。结合提出的编码方式和提出的有效性指标自动确定最佳聚类数目。最终经过大量的实验以及与其它算法对比可知,提出的方法不仅可以自动确定最佳聚类数目,并且得到了比较稳定的聚类结果。2)在任意形状数据的聚类上,本文提出了四种自动确定任意形状数据最佳聚类数目的方法。一、由于Path距离度量非常适合对任意形状的数据聚类,但较高的时间复杂度制约了其应用范围,设计了两种可以缩短Path距离聚类的计算方法:(1)使用改进的Floyd算法降低Path距离的计算时间复杂度,(2)使用一种预聚类算法降低问题的规模来降低Path距离聚类的时间复杂度,并且还设计了一种Box聚类算法可以自动的确定最佳聚类数目;二、提出了一个基于进化算法的任意形状数据自适应聚类方法。在该算法中,使用一种基于标签的编码方式对搜索空间编码,并且设计了一种改进的Modularity指标作为目标函数用来自动检测最佳聚类数目;三、由于基于标签的编码会导致染色体的长度过大,提出了一种基于实数的编码方式和一种基于距离矩阵的有效性指标对任意形状数据集进行聚类;四、前面提出的三种算法都是基于单一算法的聚类算法,方法四提出了一种进化多目标算法框架用来将不同的聚类算法有机的结合在一起。最终将提出的算法对大量的任意形状数据做聚类可得,提出的算法得到了比较好的结果。3)过分割问题和欠分割问题是图像分割中常出现的问题,在图像分割中,自动的确定最佳图像分割数目也是一个比较重要的问题。本文提出了一种结合Mean-shift算法和自适应进化聚类算法的自适应图像分割算法。首先使用Mean-shift算法对图像进行预处理,得到一幅过分割图像,然后使用自适应进化聚类算法对该过分割图像精确分割,得到最佳分割数目。该算法不仅可以降低图像分割的时间复杂度,还可以保存图像目标间的连通性。通过与其它算法对比可知,提出的方法可以有效地对图像进行分割。4)大量的图像分割算法都是基于单一特征空间的算法,即使有将多特征空间结合在一起的分割算法也是仅仅将多个特征进行直接叠加,所以在叠加时权重的设置非常困难。本文提出了一种基于进化多目标框架的图像分割算法,该算法可以将多维特征空间有机的结合在一起,并且使用颜色特征和纹理特征作为两个目标特征进行测试。最终的结果表明,提出的方法可以有机的将颜色特征和纹理特征融合到图像分割中。