论文部分内容阅读
AFS(Axiomatic Fuzzy Set)理论是一种新的模糊数学分析方法,在AFS理论框架内,给出了依据原始数据和相关信息确定隶属函数及其模糊逻辑运算的一个新算法,使得隶属函数和模糊逻辑的建立更客观、严密和统一。AFS理论已初步应用于数据挖掘,模式识别,故障诊断等领域。 刘晓东教授提出了AFS模糊逻辑的聚类分析算法(X. D. Liu, W. Wang and T. Y.Chai. IEEE Transaction on Systems, Man, Cybernetics, 2005),并将该算法应用到人工数据和真实数据集上,实验结果显示该算法能够有效地对数据聚类并能够找到最佳的类数。但是通过研究发现,算法中求每个样本的模糊描述的方法有些粗糙,而且应用的例子含有的样本太少。因此,针对此问题,本文对该算法进行了改进,并将改进后的算法应用到含有150个样本的著名数据Iris数据(见ftp://ftp.ics.uci.edu/pub/machine-learning-databases/Iris)中去,得到了较好的聚类结果。 众所周知,属性选择(特征选择)在聚类算法中起着很重要的作用,是因为在实际应用中一些属性仅仅是噪音,对聚类过程并没有任何贡献,甚至能减弱聚类算法的能力。因此,选择合适的属性进行聚类能够提高聚类准确率。本文基于模糊蕴涵算子,提出了一种选择最佳相关属性子集的算法,并结合此算法提出了一种新的AFS模糊逻辑聚类分析算法。并将此算法应用于著名数据wine识别数据。 本文的聚类分析只用到了样本在属性上的序关系。本研究表明只用样本属性上的序关系,AFS模糊逻辑聚类分析算法也能够获得很高的准确率,因此该算法能够很好的应用到那些样本属性只能用序关系描述而无法用数值描述的数据集。该算法还可以应用到多种数据类型,如数值型、Boolean型、偏序关系和人类的直觉描述等。