论文部分内容阅读
数据挖掘,是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程,并得出时间的趋向和关联,为用户提供问题求解层次的决策支持能力。当人们使用数据挖掘工具对数据中的模型和关系进行辨识的时候,通常第一个步骤就是聚类。所以聚类作为数据挖掘的主要方法之一,也越来越引起人们的关注。迄今为止,人们提出了大量聚类算法。但这些算法仅适用于特定的问题及用户,而且它们在理论和方法上仍不完善。随着数据规模越来越大,而先验知识却相对缺乏,如何解释大规模高维空间包含的数据成为一个难题。本论文在多目标进化计算的系统框架下,结合量子理论,用优化的思想来解决聚类问题,提出了量子多目标进化聚类算法,并将其用于人工数据聚类、UCI数据聚类、纹理图像分割和遥感图像分割中。主要研究内容如下:
⑴提出了一种量子多目标进化聚类方法。针对传统聚类方法仅选取一个目标函数进行优化,获得的聚类结果仅对一种分布的数据效果优越而对其它分布的数据效果不理想的缺点。该聚类方法在多目标优化的框架下,选取两个互补的目标函数,基于量子的高效并行性和量子态的叠加性,对进化种群采用量子编码,非支配排序选择和量子旋转门操作,最终利用一种半监督的方法从一组非支配解中选择一个偏好的最优解。实验表明,该方法不但具有很好的种群多样性和全局搜索能力,应用到大量不同分布的人工数据集和UCI数据集上,也获得了更高的聚类正确率。
⑵在已有的量子多目标进化聚类算法基础上,针对图像分割问题,提出一种基于量子多目标聚类的图像分割方法。该方法在对输入的图像进行特征提取和分水岭分割获得聚类数据后,先采用量子编码获得量子种群,再选取两个互补的目标函数评价聚类性能,然后用非支配排序选择以及量子旋转门进化种群,最后对聚类获得的一组非支配解解码获得类别数和类别标号,并从这组非支配解中选择一个最优个体,最优个体所对应的类别标号作为像素的灰度值,得到图像分割结果。解决了现有图像分割技术中评价指标单一、细节保持性能不好等缺点,应用于纹理图像和遥感图像上提高了图像分割的精度。
⑶针对量子旋转门操作中的需要事先给定旋转角度的缺点,提出了一种改进的量子多目标进化聚类方法。该方法通过寻找规律,自适应的计算旋转角度的大小和方向,引导种群向最优聚类中心进化,加快了收敛速度。通过对比试验,该聚类算法在聚类结果上较改进前的量子多目标进化聚类算法有所提高。