论文部分内容阅读
随着社会的进步,数据库技术的不断发展及数据库管理系统的广泛应用,数据库中存储的数据量急剧增加。但人们通过这些数据所获得的信息量仅仅是这个数据库所包含信息量的一部分,隐藏在这些数据之后的更重要的信息是关于这些数据的整体特征的描述以及对其发展趋势的预测,这些信息在决策生成的过程中具有重要的参考价值。数据挖掘技术就是适应这种要求而产生并迅速发展起来的,它为现代信息处理提供了一种新的方法和研究领域。分类一直是数据挖掘研究的核心问题,因此对分类的研究也是至关重要的。本文设计的模糊分类器主要应用了AFS理论和遗传算法。AFS理论(AxiomaticFuzzy Set,即公理化模糊集),是一种新的模糊数学分析方法,在AFS理论框架内,给出了依据原始数据和相关信息确定隶属函数及其模糊逻辑运算的一个新算法,使得隶属函数和模糊逻辑的建立更客观、严密和统一。遗传算法是以自然选择和遗传理论为基础,将生物进化过程中适者生存规则和群体染色体的随机信息交换机制相结合的高效全局寻优搜索算法。通过对AFS理论和遗传算法的研究,充分利用两者的优点,提出了一种将AFS理论和遗传算法相结合的模糊分类器。应用AFS理论对模糊概念的隶属度求解方法,得到数据集属于各个简单概念的隶属度,该隶属度求解方法依据原始数据和相关信息,不需要重新调节;根据得到的隶属度求取设计分类器需要的模糊规则集,并通过预先筛选得到候选规则;应用遗传算法进行规则的提取,采用AFS理论将提取后的模糊规则集合并成为模糊描述,得到的模糊描述构成一个模糊分类器。将本文设计的模糊分类器应用到UCI(University of California,Irvine)机器学习数据库(网址为http://www.ics.uci.edu/~mlearn/MLRepository.html)的iris,wine,breast cancer三个实际数据集上验证算法的有效性。从实验结果可以看出将两者结合设计出的模糊分类器具有分类准确率高、模糊描述简单、规则少且易于理解等特点。并和相关文献进行了比较,分析了算法的优点和不足。